結論から言う 「PDFをMarkdownに変換すればAIの読解精度が上がる」という仮説は、半分正しく半分間違いだった。 正確には、 モデルごとに最適な入力形式が異なり、変換効果はモデルの読解戦略に依存する 。ClaudeはPDFでもMarkdownでもほぼ同等の精度を出すが、Geminiにとってはフォーマットより「どう読むかの指示」の方がはるかに重要だった。そしてもっと面白い発見がある。Claudeが「賢い」のは、モデルが賢いからではなく、 自律的に文書を分割して複数回読んでいる からだ。 実験の設計 補助金の公募要領や交付要綱は、研究者が日常的に読まされるタイプの"読解地獄"文書だ。細則が多く、重要な数値が条文の中に埋もれており、読み落としが致命的なミスにつながる。こういった文書をAIに正確に処理させられるかどうかは、実務上の重大な問題になりつつある。 今回は2文書を用意した。先端研究基盤刷新事業(EPOCH)の令和8年度公募要領(PDF 1.9MB・68ページ)と、地域産学官連携の補助金交付要綱(PDF 390KB・20ページ)だ。それぞれをPDF形式とMarkdown形式(Markitdownで変換)の2種類に変換し、独立したAIエージェントに読ませた。 質問は3問に統一した。200字での要約、重要数値の完全列挙、そして注意すべき重要ポイント3つの提示だ。テストしたモデルはClaude Sonnet 4.6、Gemini Flash、Gemini 2.5 Pro(標準指示)、Gemini 2.5 Pro(網羅指示)の4条件。採点はClaudeとGemini双方に独立して行わせた。 発見1:ClaudeはどちらのフォーマットでもPDFを「分割読み」していた 最初に気づいたのはトークン消費の非対称性だ。 EPOCH公募要領(68ページ)を読ませたとき、Claude SonnetはPDF版で77,855トークン、Markdown版で77,036トークンを消費した。 ほぼ変わらない 。しかし把握した文字数は全く異なる。PDF版が約65,000字であるのに対し、Markdown版は約140,000字——2倍以上だ。 これはなぜか。Claudeのエージェント動作を観察すると、ReadツールをPDF・Markdownのいずれでも複数回に分けて呼び出し...