main-image

LLMを悩ませる"Excel文書"をうまく扱う方法

テキスト生成
clock

更新日2024.12.10

株式会社ファースト・オートメーションCTOの田中(しろくま)です! 弊社では製造業向けのRAGを使ったチャットボットの開発を行っていますが、 RAGで読み取りづらいなと感じているドキュメントが"Excel文書"です。 ここで"Excel文書"と呼んでいるドキュメントは、 「構造化されたテーブルを保存しているExcelファイル」 ではなく、 「セルに文書を書いたり、オブジェクトや画像を挿入することで、いわゆる一般的な文書を作成しているExcelファイル」 のことを呼んでいます。 そもそも一般的な文書作成においてはExcelではなく、Wordを使えばよいのでは?と思われるかもですが、以下の点でExcelで文書の資料を作成することはそれなりに便利な部分があると思っています。 枠を使って、グルーピングすることでドキュメントの構成が見やすくなる セルを使うことで、空白や文字の開始位置を正確に制御でき、文字を綺麗に揃えやすい 先に一枚絵を作ってしまって、後からページの切り方を調整できる グラフやオブジェクトも入れられる このような機能は、WordやPowerPointに比べ、文書を 『整えながら自由に』