Desmond Li — NEOX アルゴリズム・セマンティックエンジニアリング責任者

Desmond Li

NEOX R&D コア · 博士率いるアルゴリズム

Mattock™ AI トレーニングセンター:データフィードとトレーニングのクローズドループは李博士チームが主導。

李博士は NEOX チップ、Mattock モデル、メディア AI エージェントの研究開発を率い、NEOXGEO の GEO デリバリーと一体で推進しています。

NEOX テックシリーズを見る
GEO・Mattock AI トレーニングセンター:セマンティック抽出とモデルトレーニングを想起させるヒーロー背景
Process-Driven

Mattock™ AI トレーニングセンター

企業ナレッジを AI の記憶へ

Mattock™ AI トレーニングセンターでは、ナレッジを構造化し検証し、バッチでフィード——生成回答の語りに根拠を持たせ、持続的に改善できる状態をつくります。

  • コーパス・バージョン
  • フィードリズム
  • 監査トレイル
  • 四半期レビュー
training.run · job queue
active
queue18 jobs
next slot4m 12s
ok rate99.1%
ingest.corpusshard_a ✓
matrix.validatestruct_ok ✓
edge.feed / clusterbatch 7 running

イメージ:ジョブキューとハードウェアフィード状態。実際の指標は契約と環境によります。

コア機能

ガバナンスからフィードまで、検証可能なトレーニングチェーン

トレーニングセンターは「コンテンツ」を「トレーニング可能なセマンティック資産」に変えます。バージョン管理でき、実験と照合でき、コンピュートと同じテンポで観測できます。

セマンティック資産とナレッジガバナンス

エンティティとシナリオ軸でコーパスを編成し、検証可能なスニペットと系譜を出力。外向きの語りと内部ナレッジベースを揃え、口径のドリフトを抑えます。

フィードリズムとキュー編成

契約とリスク境界に沿ってスループット、リトライ、クールダウンを調整。複数ジョブが並行しても各バッチの状態と担当者を追跡できます。

測定可能なトレーニング目標

引用分布、ブランド文のカバー、ネガティブ表現の抑制など成功の姿を先に定義し、周期サンプリングで検証——産出だけが先行しないようにします。

仕組み

インサイトとフィード:二層分担、一本の説明責任線

まず「外からどう言われているか」と「どう言われたいか」のギャップを詰め、承認済みコーパスのみをバッチ化。実行は検証済みコンテンツだけを触り、計測結果が次の優先順位に書き戻されます。

インサイト層 · メンションとギャップ

サンプル・対照・優先順位

公開の見え方と引用パターンを周期的にサンプルし、ブランド主張と競合語りと対照。書き換えすべき段落、証拠を補うべきエンティティ、事例が必要なシナリオをバックログにします。

  • ギャップ優先順位
  • リスクガードレール
  • コンプライアンスチェック
  • 戦略イテレーション

トレーニング層 · Mattock™

マトリクス・キュー・エッジフィード

ガバナンス後のナレッジベースからタスクを生成し構造を検証、キューを編排。エッジノードとフィンガープリントとリズムを整合させ、挙動・時系列・ノードが監査とリプレイ可能になります。

  • ハードウェアノードとタスクノードが一対一対応しリプレイ可能
  • コンテンツとマトリクス版本が実験間で突き合わせ可能

パイプラインの読み方

コンテンツ入口からフィード出口まで一本線

動画は理解補助用です。左は企業がコントロールするナレッジと素材、中央で構造化とタスク分割、右はエッジノードがリズムで送出——ベンダーは差し替え可能でも、「先にコンテンツ、後で規模」の順序は変わりません。

ナレッジ入口 → 構造化とタスク編排 → エッジフィードと外部エンドポイント(イメージ/単一製品に限定しない)。
品質ゲート

投入前検証

  • · 構造化マトリクスとエンティティ関係の一貫性——幻覚や矛盾する語りを抑える。
  • · センシティブ・コンプライアンス文脈のフラグ付け、オプションでヒューマンインザループ。
  • · タスクシャードとノード重みが具体的なコーパス版本までトレース可能。
テレメトリと版本

周期ロールアップ用の指標バンド

  • · 複数サーフェスの引用シェア、ナラティブドリフト、競合文ベースライン(サンプル)。
  • · フィードバッチの成功率、遅延、監査イベントログ。
  • · メジャー版本変更と A/B トラックを並行観測。

Feeding Logic

4 ステップ:採集・マトリクス・ハードウェアフィード・クローズドループ

プロセス主導のデリバリー:各ステップに監査可能な成果物(コーパス版本、マトリクス検証、フィードバッチ)を残し、周期レビューにつなげ——生成 UI 上でブランド語りが理解され、引用され、繰り返し最適化されます。

  • 01

    Amoeba Data Extraction

    データ採集と抽出

    PDF、公式サイト、SNS など分散ソースをスキャン・クリーニング。引用に耐える権威ある文を残し、ノイズと陳腐な語りを落として後段の構造化にクリーンな原料を用意します。

  • 02

    Exclusive DB Matrix

    専用データベースマトリクス

    ブランドシーンとエンティティ関係に沿ってマトリクスを構築。項目は検証でき出所まで追跡可能で幻覚生成を抑え、更新リズムはバージョン番号に記録して差分とロールバックを容易にします。

  • 03

    Hardware-Led Logic Feeding

    ハードウェア級ナレッジフィード

    エッジノード · タスクマトリクス

    専用コンピュートとエッジノードがフィード負荷を担い、実インタラクションに近いリズムでバッチを処理。ノードとタスクが対応し、監査とリプレイ要件を満たします。

  • 04

    Closed-Loop Evaluation

    クローズドループ評価と再トレーニング

    計測結果から優先順位を書き戻し——どの語りが引用されたか、どこがまだ薄いか——に基づき次ラウンドのコーパスとフィード戦略を調整し、反復可能な改善ループを形成します。

方法論サマリー

まず証拠、次にリズム、最後に規模

トレーニングセンターは三つを同時前提にします:コーパスは抜き取り検査できる、タスクは再演できる、結果は説明できる。規模のフィードは「各バッチに痕跡がある」ことを前提に——その逆ではありません。

  • 各バッチをコーパス版本と承認記録にバインドし、口径ドリフトを防ぐ
  • 実験と対照を並行でき、データで社内合意を形成しやすい
  • 指標は「次に何を書き換え、どの証拠を足すか」といった行動可能な差分だけを追う