![ヤマゾー@AIエンジニア Profile](https://pbs.twimg.com/profile_images/1256436707001380864/UdWTfjt1_x96.jpg)
ヤマゾー@AIエンジニア
@yamazombie1
Followers
5K
Following
5K
Statuses
2K
大手SIerの研究所勤務|大規模案件PL→生成AIエンジニアに社内異動|TOEIC 950|AWS認定12冠(CLF満点/平均903点)|LLM×システム開発|ITエンジニアの資格は意味あり派|アンチ情報商材屋|時々Qiita|Youtuber見習い (ゲーム実況/登録者150人強)|最近フォロバ率低め
東京
Joined January 2012
@osakasnkers34 RAGの仕組みを実装できただけで「RAGなんて誰でもできる」と豪語する方をよく見かけますが、それがRAGシステム全体の1割にも満たない事実は意外と知られてないですよね…。 実際は文書やクエリの加工処理も奥が深いし、ピンクで示した運用保守も含めると寧ろアーキテクト人材の素養が求められますね!
1
0
2
RT @yamazombie1: RAGシステムの精度改善フローを描いてみた。 生成AIを企業で本格的にシステム導入する場合、継続的に精度を測定・改善する運用設計が重要。 これからのITエンジニアは簡単なRAGを実装するだけでなく、生成AIシステムの運用保守まで考慮したアー…
0
76
0
@yokusuru100 企業データは固有の用語や業務単位を含み100GB以上あるので、その辺の単純な教師なしアプローチでは扱えないと思いますね…。効果は一般化できないですが、回答精度は20%以上変わると思います。 平易な言葉で書かれた少量データであれば、わざわざ自前でRAGを実装する必要はないという点は同意です!
0
0
6
@kisukesantamari ですね!代表例だと以下もありますね: ユーザ入力:質問時にフィルタ条件を指定させる、質問と関連度の高いFAQやプロンプト例を提示して良い入力を想起させる(入力の加工は検索ロジックの役割かなと) データ加工:Officeファイルのテキスト抽出方式やOCR、構造化(MarkdownやMermaidなど)
1
0
2
@keraleralera とんでもないです!RAGの精度はほぼ検索精度で決まるので、インデクシングは一番重要ですし、(適用領域を選んだうえで) 適切に行えば充分実用に耐えうると思います。 単にチャンクサイズを調整するだけでなく、文書を検索しやすいように加工する工夫も重要です。例えばAWSの手法は参考になりました!
AWSが提唱したRAGの手法、これは使えそう。 LLMに文書データのジャンル分けとジャンル毎 (の想定質問) の要約をさせておいて、ユーザーがジャンルを指定して質問文を入力すると、LLMが該当ジャンルの要約に基づいて質問文を複数の質問に分けて並列に検索するアーキテクチャ。
1
1
6
@kisukesantamari 更に言えば、よくあるベクトル検索やらハイブリッド検索を試すのもいいですが、データ中心なアプローチ (大雑把に言えばユーザのクエリ起点ではなく、データ側を充実させることで精度を上げる手法) こそが重要だと考えています! 例えばAWSが出したRAGの論文は非常に参考になりました。
AWSが提唱したRAGの手法、これは使えそう。 LLMに文書データのジャンル分けとジャンル毎 (の想定質問) の要約をさせておいて、ユーザーがジャンルを指定して質問文を入力すると、LLMが該当ジャンルの要約に基づいて質問文を複数の質問に分けて並列に検索するアーキテクチャ。
1
0
5
@keraleralera 私の周りを見ている限り、寧ろRAGはPoCを一通り終えて、現実的な適用範囲で実機化するフェーズに移ってる印象ですね。 実際、AWSやAzureもRAG系サービスの開発を盛んに行っており、特に精度監視などの運用系、インデクシングなどのデータエンジニアリング系の重要性が増しているように感じます。
1
1
5