議題1: RAGの基礎
佐藤さんより、RAG(Retrieval-Augmented Generation)の基本的な仕組みについて発表がありました。
ポイント
- RAGはLLMに外部知識を与える手法
- ドキュメントをチャンク分割→ベクトル化→検索→LLMに入力の流れ
- ハルシネーション対策として有効
- チャンクサイズの設計が精度に大きく影響する
議題2: ベクトルDBの比較
以下のベクトルDBについて比較検討を行いました。
| DB名 | 特徴 | コスト |
|---|---|---|
| Pinecone | マネージド、簡単 | 有料 |
| Chroma | ローカル利用可 | 無料 |
| Weaviate | 多機能 | OSS/有料 |
議論
- 小規模なPoCにはChromaが最適
- 本番運用を見据えるならPineconeが安定
- Weaviateはハイブリッド検索が魅力的
次回アクション
- 田中:Chromaを使ったRAGのデモを作成
- 鈴木:チャンク分割手法の比較資料を用意