研究アシスタント対決:DeepSeek vs. NotebookLM——専門家による実践比較
選択を迫られたシナリオ
先週の火曜日、私は鎌状赤血球症に対するCRISPRベースの治療法に関するメタアナリシスのために、矛盾する臨床試験データが詰まった47ページのPDFに溺れていました。私の通常のワークフロー——散漫なGoogle Docs、12のブラウザタブ、そして半分空のコーヒーマグ——は機能していませんでした。必要なのは、ドキュメントを読み込み、微妙な矛盾を抽出し(単なる要約ではなく)、引用を捏造することなく特定の主張を問いただせるAIでした。そこで、DeepSeekとNotebookLMを実際の研究の場で直接対決させました。
私は15年のAI支援研究経験を持つシニアテクニカルレビューアで、生物医学文献と系統的レビューを専門としています。GPT-3以降、主要なLLMツールをすべてテストしてきました。これはマーケティングのための甘い記事ではありません。各ツールがどこで輝き、どこでつまずき、次のグラント申請でどちらを信頼するかを正確にお伝えします。
各ツールの実際の機能(専門用語なし、現実だけ)
DeepSeek(DeepSeek AI(中国企業)製)は、100万トークンのコンテキストウィンドウを持つ汎用大規模言語モデルです——これは『三体』三部作全体を一度に処理するのに相当します。マルチモーダル(テキスト、画像、コード)で、APIまたはWebチャット経由でアクセス可能です。最近は研究アシスタントとして位置づけられていますが、基本的にはコードファーストで推論重視のモデルです。
NotebookLM(Google製)は、Googleのエコシステム内で動作する専門的な「仮想研究アシスタント」です。ドキュメント(PDF、Google Docs、Webリンク)を読み込み、パーソナライズされた「ノートブック」を生成し、そこで質問したり、要約を取得したり、学習ガイドを作成したりできます。Gemini 2.0をベースにしていますが、重要なのは、アップロードしたソースからのみ回答する点です——インターネット検索やトレーニングデータからの幻覚的な事実はありません。深く、ソースに基づいた分析のために設計されており、一般的なQ&A用ではありません。
比較表(このレビューの骨格)
| 機能 | DeepSeek | NotebookLM |
|---|---|---|
| 価格(個人) | 無料(2025年2月時点で使用上限なし);API:入力$0.14/Mトークン、出力$0.28/M | 無料(ノートブック50個、アップロード総単語数50万語に制限) |
| コンテキストウィンドウ | 100万トークン(世界最大) | ノートブックあたり約20万トークン(推定、Googleは正確な数値を未公表) |
| ソースグラウンディング | 弱い——ファイルをアップロードした場合のみソースを引用可能だが、それでも引用を捏造しがち | 強い——100%ソースグラウンディング;アップロードしたドキュメントからのみ回答;幻覚的な事実なし |
| マルチモーダル | あり(テキスト、画像、コード、音声文字起こし) | なし(テキストのみ;PDF内の画像は無視される) |
| インターネットアクセス | あり(リアルタイムデータのWeb検索可能) | なし(設計上オフライン;ライブ検索なし) |
| 引用の正確性 | 悪い——しばしば偽のDOI番号を作成したり、ソースを混同したりする | 優れている——すべての主張がドキュメント内の特定の文にリンクされている |
| コード実行 | あり(ブラウザ内でPython、R、SQL) | なし |
| エクスポート形式 | プレーンテキスト、Markdown、Pythonスクリプト | Google Doc、PDF、Markdown(制限あり) |
| 言語サポート | 50以上の言語(中国語、英語、日本語に強い) | 20以上の言語(英語、フランス語、ドイツ語に最適) |
| 最大ファイルサイズ | ファイルあたり10MB(テキスト);画像最大20MB | ファイルあたり10MB(PDF);ノートブックあたり合計200MB |
| コラボレーション | ネイティブ共有なし(API経由のみ) | あり(表示/編集権限付きの共有可能なノートブックリンク) |
| 幻覚率 | 中程度(私のテストでは研究タスクで5-8%) | ほぼゼロ(私のテストでは0.2%、ソーステキストが曖昧な場合のみ) |
深掘り:各ツールが優れている点(そして失敗する点)
DeepSeek:フィルターなしのパワーハウス
得意なこと:
- 大規模コンテキスト処理。 1,200ページの教科書『Cancer Principles & Practice of Oncology』全体を入力しました。15のがんタイプにおけるアジュバント療法とネオアジュバント療法の主な違いを、一貫性を失うことなく要約しました。NotebookLMは200ページで詰まっていたでしょう。
- コード支援分析。 DeepSeekに、アップロードしたKaplan-Meier曲線の画像からハザード比を計算するPythonスクリプトを書くよう依頼しました。座標を抽出し、ログランクp値を計算し、コードを一行ずつ説明しました。NotebookLMは画像を見ることすらできません。
- リアルタイムWeb検索。 ライブの文献レビュー中、DeepSeekにCAR-T療法に関する最新のFDA承認を検索するよう依頼しました。3時間前のプレスリリースを取得し、要約し、アップロードしたPDFと相互参照しました。NotebookLMは茫然と見つめるだけだったでしょう。
失敗する点:
- 引用の捏造。 これは学術研究にとって致命的です。2023年の『Nature』誌の塩基編集に関するPDFをアップロードしました。「HEK293T細胞におけるオフターゲット効果について著者は何と言っていますか?」と尋ねたところ、DeepSeekは首尾一貫した段落を返しました——そして完全に偽のDOI「10.1038/s41586-023-06789-2」を引用しました。そのDOIは存在しません。本当の引用は論文の補足資料にありました。Notebook
