LLMの基礎 — 何ができて、何ができないのか | 株式会社ルーパス

ChatGPT が広く使われるようになって以降、AI 導入の現場で「LLM」という言葉を聞かない日はなくなりました。一方で、何がどこまでできるのかは過大評価・過小評価のどちらも生まれやすく、議論が噛み合わない場面もよくあります。

本記事では、技術詳細にあえて踏み込まず、LLM が得意なこと・苦手なこと を業務目線で整理します。

LLM が得意なこと

LLM は要するに「次の単語を確率的に予測する」モデルです。そのシンプルな仕組みから、以下の業務は特に得意です。

テキストの要約・整形: 議事録のサマリー、長文メールの 3 行要約
質問応答 (FAQ ベース): 既存ドキュメントを参照しつつ回答を生成
下書き・たたき台作成: 提案書のドラフト、メール返信文の候補
コードの説明・補完: 既存コードの意図理解、シンプルな関数の生成
多言語翻訳: 業務文書レベルなら高品質

LLM が苦手なこと

逆に、以下のタスクは LLM だけでは限界があります。

厳密な数値計算: 大きい桁の計算、複雑な金融計算は数式エンジン併用が必須
最新情報の参照: 学習時点以降の情報は持たない(RAG や検索連携が必要)
事実の絶対保証: もっともらしいが間違った答えを返すことがある (ハルシネーション)
業界固有の専門知識: ニッチな業界用語や社内固有の文脈は理解が浅い
長い文脈の安定処理: 数百ページ規模になると精度低下が目立つ

# 数値計算は LLM ではなく確定的なツールに任せるのが定石
# LLM はツール呼び出しのオーケストレーターとして使う
def calculate_roi(invest: float, annual_gain: float) -> dict:
    payback_years = invest / annual_gain
    return {"payback_years": payback_years}

業務適用の判断ポイント

LLM を業務に組み込む前に、3 つを確認すると失敗が減ります。

1. 出力の正しさを誰が、どうやって確認するか

LLM の出力は確率的なので、誤りが含まれる前提で運用設計します。人の最終確認、別ツールでの再検証、信頼スコア表示などを組み合わせます。

2. データを外部に出して良いか

クラウド LLM (ChatGPT API、Claude API、Gemini API 等)を使う場合、入力データは外部に送信されます。個人情報や機密情報を含む場合、契約・暗号化・オンプレ LLM(Llama 系等) の検討が必要です。

3. コストモデルを確認したか

API 課金は入力・出力トークン数に依存します。利用ボリュームが見えていない状態で導入すると、月額コストが想定外に膨らむことがあります。月間トークン量の試算は早めに。

まとめ

得意	苦手
要約・整形	厳密な数値計算
FAQ 応答	最新情報参照(単独では)
下書き作成	事実の絶対保証
コード説明	業界固有のニッチ知識
多言語翻訳	超長文の安定処理

LLM は万能ツールではなく、特定の文脈で力を発揮するパーツ です。業務適用では、LLM 単体ではなく、他のツールや人手と組み合わせて設計するのが現実的な解です。

LLM 活用のご相談はこちら

#LLM#生成AI#技術解説