
はじめに
2026年3月24日、経済産業省とNEDOが主催するGENIAC-PRIZEの表彰式が神田明神ホールにて開催されました。
GENIAC-PRIZEは、生成AIサービスによる解決が望まれるテーマで開発・実証したAIアプリケーションを募集し、成果に応じた懸賞金を授与するプログラムで、懸賞金総額は約8億円です。
弊社は「領域02:官公庁等における審査業務等の効率化に資する生成AI開発」に応募しました。この領域では特許審査業務をモデルとして、情報探索等を効率化するAIの開発が求められました。
審査の結果、領域02では1位〜3位に該当する受賞者は不在となりましたが、弊社は新規技術賞(特別賞)を受賞しました。また、特別賞受賞者の代表2社の1つとして表彰式でプレゼンテーションも行いました。
開発したシステム
「審査官の思考プロセスを再現する、特許先行技術調査支援AIシステム」を開発しました。
特許審査官が行う「クレームの構造化 → 証拠の探索 → 対比判断」という一連の思考プロセスを、独自に特許データで学習した複数のAIモデル群で再現するシステムです。
今回は、OpenAIのGPTやGoogleのGeminiといった外部AIサービスを一切使わず、完全ローカルのAIモデル群で構成しました。
生成・推論モデルとしてはQwen3-30B-A3B-Baseを採用し、特許公報・審判公報・拒絶理由通知・審査基準等1,000億トークン超のデータで継続事前学習(CPT)を行った上で、クレーム構造化や根拠生成などのタスクをSFTで学習させました。これにより、プロンプト(指示文)なしでデータを入力するだけで動作する「プロンプトレス推論」を実現しています。
検索モデルとしてはQwen3 Embedding 4Bをベースに、過去の審査官による引用実績を教師データとした対照学習を行い、特許審査に特化したEmbeddingモデルを構築しました。請求項の抽象的な表現(例:「弾性部材により付勢される」)と明細書の具体的な記載(例:「圧縮コイルばね(0.5N/mm)で押圧」)の間にある「意味の壁」を対照学習で埋めることで、Recall@100が42.22% → 70.22%に大幅向上しています。
最後に
今回の開発期間中はQwen3ベースで学習を進めましたが、その後かなり性能が向上したQwen3.5モデルが登場するなど、LLMの進化は速く、正直LLMの独自学習のコスパはあまり良くありません。ただ、今回構築した継続事前学習(CPT)・SFT・GRPOの教師データや学習パイプラインは、ベースモデルが変わっても活かせるものですので、これらの資産をベースに独自性のある特許特化AIモデルの開発に引き続き取り組んでいこうと考えています。