ChatGPT が広く使われるようになって以降、AI 導入の現場で「LLM」という言葉を聞かない日はなくなりました。 一方で、何がどこまでできるのかは過大評価・過小評価のどちらも生まれやすく、議論が噛み合わない場面もよくあります。
本記事では、技術詳細にあえて踏み込まず、LLM が得意なこと・苦手なこと を業務目線で整理します。
LLM が得意なこと
LLM は要するに「次の単語を確率的に予測する」モデルです。 そのシンプルな仕組みから、以下の業務は特に得意です。
- テキストの要約・整形: 議事録のサマリー、長文メールの 3 行要約
- 質問応答 (FAQ ベース): 既存ドキュメントを参照しつつ回答を生成
- 下書き・たたき台作成: 提案書のドラフト、メール返信文の候補
- コードの説明・補完: 既存コードの意図理解、シンプルな関数の生成
- 多言語翻訳: 業務文書レベルなら高品質
LLM が苦手なこと
逆に、以下のタスクは LLM だけでは限界があります。
- 厳密な数値計算: 大きい桁の計算、複雑な金融計算は数式エンジン併用が必須
- 最新情報の参照: 学習時点以降の情報は持たない(RAG や検索連携が必要)
- 事実の絶対保証: もっともらしいが間違った答えを返すことがある (ハルシネーション)
- 業界固有の専門知識: ニッチな業界用語や社内固有の文脈は理解が浅い
- 長い文脈の安定処理: 数百ページ規模になると精度低下が目立つ
# 数値計算は LLM ではなく確定的なツールに任せるのが定石
# LLM はツール呼び出しのオーケストレーターとして使う
def calculate_roi(invest: float, annual_gain: float) -> dict:
payback_years = invest / annual_gain
return {"payback_years": payback_years}業務適用の判断ポイント
LLM を業務に組み込む前に、3 つを確認すると失敗が減ります。
1. 出力の正しさを誰が、どうやって確認するか
LLM の出力は確率的なので、誤りが含まれる前提で運用設計します。 人の最終確認、別ツールでの再検証、信頼スコア表示などを組み合わせます。
2. データを外部に出して良いか
クラウド LLM (ChatGPT API、Claude API、Gemini API 等)を使う場合、入力データは外部に送信されます。 個人情報や機密情報を含む場合、契約・暗号化・オンプレ LLM(Llama 系等) の検討が必要です。
3. コストモデルを確認したか
API 課金は入力・出力トークン数に依存します。利用ボリュームが見えていない状態で導入すると、 月額コストが想定外に膨らむことがあります。月間トークン量の試算は早めに。
まとめ
| 得意 | 苦手 |
|---|---|
| 要約・整形 | 厳密な数値計算 |
| FAQ 応答 | 最新情報参照(単独では) |
| 下書き作成 | 事実の絶対保証 |
| コード説明 | 業界固有のニッチ知識 |
| 多言語翻訳 | 超長文の安定処理 |
LLM は万能ツールではなく、特定の文脈で力を発揮するパーツ です。 業務適用では、LLM 単体ではなく、他のツールや人手と組み合わせて設計するのが現実的な解です。
