超お手軽にRAGが作れてしまう凄い奴、Google NotebookLM(を更に使い倒す拡張機能の紹介)
最近、LLM関連の大きめのニュースが続いていますね。
一番世の中を騒がせているのはChatGPT4oの画像生成の新しいモデルのリリースかと思いますが、GoogleのGemini 2.5 Proの発表もその一つです。ChatGPT4oの新しい画像生成モデルはまだ無料ユーザーには解放されていませんが、Gemini 2.5 Pro の方は数日前から無料ユーザーでも使えるようになりましたので、ぜひ試してみてはいかがでしょうか?
もちろん最新のLLMモデルも素晴らしいのですが、GoogleのAIプロダクトのシリーズの中でも私が活用しているのが、Geminiを使った簡易RAGを超簡単に作れてしまうGoogle NotebookLM です。
RAG(ラグ)って何?っていう方もいらっしゃるかもしれませんが、LLM(Learge Language Model = 大規模言語モデル)を使った生成AIの一番と言っても良い弱点のハルシネーションの問題を解決しつつ、企業などが持つファーストパーティーデータや一次情報を活用した問い合わせシステムや分析などを簡単に出来てしまう画期的な仕組みです。"Retrieval Augmented Generation" の略ですが、直訳すると「検索 拡張 生成」、日本語にするとちょっと意味がわかんないですが、超簡単に説明すると、喰わせたドキュメントを生成AIが検索して、そのドキュメントの中の情報「だけ」を元に回答を生成してくれる感じです。
これによって解決するのが、ハルシネーションの問題。
生成AIは基本的に「わかりません」が言えません。
なぜならば、膨大な学習データからもっとも入力プロンプト(を分解したトークンのベクトル集合)に近い文章を紡ぎ出す仕組みなので、例え学習データに答えが入っていなくても最大限それっぽいことを返してしまいます。究極のしったかぶりですね。
それに対してRAGを使うと、ドキュメントの検索結果が無い=「資料に無いのでわかりせん」が言えるようになります。
あと、RAGを使うことの大きなメリットのひとつに、最新の情報を元に生成AIが回答を作ることができることが挙げられます。生成AI=LLMは膨大な学習データを膨大な計算パワーを使ってモデルを作る必要があるので、ある断面までの学習データしか学習できていないのです。例えばChatGPT4oの場合のデータのカットオフは2024年6月まで。それ以降に世の中に初めて出てきた情報に関してはChatGPTは知識として持つことができませんが、RAGを使って最新の情報を分析・参照することによって、最新の情報を元に回答することが出来るようになります。
そんなRAGですが、いざ作ろうと思うと結構大変ですが、Googleが2023年に米国でまずリリースし、2024年に日本を含む180ヵ国以上のユーザーに解放したGoogle NotebookLMでは数分でいとも簡単に簡易的ではありますがRAGが作れてしまいます。
具体的にどう使うのか。
基本的な活用方法は非常にシンプルです。
まず、WebブラウザでNotebookLMにアクセスし、Googleアカウントでログインします。次に「新しいノートブック」を作成し、そこに関連する情報を「ソース」として追加していきます。ソースには、PDFファイル、Googleドキュメント、コピー&ペーストしたテキスト、そしてWebサイトのURLなどを指定できます。
ソースを追加すると、NotebookLMがその内容を自動的に解析・インデックス化してくれます。準備ができたら、あとはチャット形式で質問したり、要約を依頼したり、アイデアのブレインストーミングをしたりするだけです。NotebookLMは、追加したソースの情報『のみ』に基づいて回答を生成してくれるため、信頼性の高い情報を得やすいのが大きな利点です。
【活用例:難解な法律文書の読解とQ&A】
NotebookLMが特に役立つと感じる場面の一つが、複雑な文書の読解です。例えば、一般人には難解な法律の条文を理解したいとき。特定の法律(例えば、「労働基準法」や「個人情報保護法」、「公職選挙法」など)のPDFファイルのURLをソースとしてNotebookLMに追加します。
法律のPDFファイルは「XX法 全文」などと検索すれば大抵検索結果の一番上に「e-Gov 法令検索」という国(現在はデジタル庁)がやっているサイトが出てきます。こちらに各種法令のデータが掲載されており、例えば「公職選挙法 全文」と検索すると以下のサイトが検索トップに出てくるので、それを開いてください。
https://laws.e-gov.go.jp/law/325AC1000000100
ここで注意が必要なのが、上記のWebページのURLを登録しても、Google NotebookLMは法律の条文を読み込んでくれません。フレームが複雑だったり、うまくGoogleの検索INDEXにおさまらないページは、PDFにしてまとめてアップすることをお薦めします。この辺は、先日の記事でお伝えしたLLMOをe-Gov側でやってくれれば良いのですが。。
e-Govではどうすればよいかというと、条文全文を開いた画面の右下に「印刷 ダウンロード」というリンクメニューがありますので、ダウンロードを押してください。
すると、モーダルウィンドウが表示され、以下の形式で法律条文の全文ファイルをダウンロードすることができます。
XML HTML RTF PDF 横一段 PDF 縦一段 PDF 縦二段 PDF 縦四段
おススメはPDFの横一段、他の形式でも問題ないかもしれませんが、XMLとかHTML系のテキストファイルはtxtかmdしか受け付けないので避けた方が良いです。
ダウンロードでもURL貼り付けでも良いですが、法律みたいに一度発効したらなかなか変わらないものだったら良いのですが、更新されるようなファイルの場合はダウンロードもしつつ、URLをメモっておくと後でご紹介するツールでネット上のPDFファイルが更新されたら、簡単な操作で更新できたりするのでURLをメモっておくとよいかもです。そうでない場合は、ダウンロードしておいた方がまとめてドラッグ&ドロップもできるし、手元で開いて確認もできるのでダウンロードしておいた方が良いかな。
ソースを登録したらこれだけで準備完了。
そして、「〇〇(特定の状況)の場合、どの条文が関連しますか?」とか、「第〇条の具体的な意味を、専門用語を使わずに説明してください」といった質問を投げかけることができます。NotebookLMは、ソース内の該当箇所を引用しながら、分かりやすく回答を生成してくれます。これにより、法律の専門家でなくても、難解な文書の内容を効率的に把握し、必要な情報を素早く見つけ出す手助けとなります。
でも、法律には興味が無いよっていうそこの貴方
今、世の中が大注目しているフジテレビの中居くん問題の第三者委員会が公表した調査報告書 、いろいろな識者?の方が読み込んで発言をされていますが、この調査報告書、要約版で58ページ、要約してないバージョンではなんと291ページもあるのですよね。
でも、このPDFをGoogle NotebookLMに読み込ませればものの数分でこの報告書をしっかりと読み込んだ専門家が貴方の質問に答えてくれますし、いろいろな識者?の方の発言の裏もしっかりとることが出来るのです。
例えば、以下の質問(数字の部分は実際はクリックすると引用先・参照先が表示される)
「U氏とは誰か?」
「情報源に基づくと、「U氏」は タレント であることがわかります 1 ... 。
「U氏」は、外資系ホテルαのスイートルームで開催された会合(いわゆる「スイートルームの会」)に参加していました 1 ... 。この会合には、中居氏、B氏、女性アナウンサーのR氏とQ氏、そしてB氏を含むスタッフ数名も参加していました 1 。
会合中、中居氏がB氏を含むスタッフに対し、スイートルームから退出するように働きかけました 4 。B氏は、中居氏がタレントであるU氏と女性2名(R氏とQ氏)の男性2名対女性2名という状況を作りたいと考えていると受け止め、他のスタッフとともに退出しました 2 。
スタッフ退出後、U氏とR氏がそれぞれ席を立ち、一時的に離席していた時間帯があったとQ氏は述べています 6 。
第三者委員会は、この「スイートルームの会」における状況について調査を行いましたが、タレントU氏に対して書面でヒアリングへの協力を要請したところ、情報漏洩のリスクなどを理由に拒否されたため、ヒアリングを実施することはできませんでした 9 。
これらの情報から、「U氏」は、ある会合において中居氏と共に、結果的にセクシュアルハラスメントが発生する状況に関与したタレントであることが示唆されています。」
「中居氏は犯罪者?」
「 情報源とこれまでの会話に基づくと、 中居氏が法的な意味で犯罪者であると断定することはできません 。
•報告書は、複数の事例において 中居氏によると思われるハラスメント行為 について言及しています。
Q氏の証言によれば、「スイートルームの会」において、中居氏がQ氏の膝や肩、鎖骨付近に触れたり、顔を近づけるなどの行為があったとされています 1 。第三者委員会は、中居氏の否定的な供述よりもQ氏の供述の方が具体性、一貫性があり信用性が高いと判断しています 1 。
女性Aとの件(「本事案」)に関しても、中居氏の誘いを断ることで今後の仕事に差し障ると女性Aが感じ、意に反して会食に参加した状況が記述されています 2 。その後のやり取りでは、女性Aが見舞金について第三者を介した誠実なやり取りを求めたのに対し、中居氏は対立構造になることや弁護士費用を懸念するメッセージを送っています 3 。
•報告書は、これらの行為を 人権侵害 と捉える可能性や、CXが取引先(中居氏のようなタレントを含む)による人権侵害のリスクを「助長」していた可能性について議論しています 4 ... 。
•ただし、報告書は第三者委員会による事実調査の結果をまとめたものであり、 刑事事件としての有罪判決や法的措置について言及しているわけではありません 。
•私たちのこれまでの会話でも、「スイートルームの会」における中居氏の行為はセクシュアルハラスメントに該当する可能性が示唆されていますが、それが 犯罪として法的に認定されたという情報はありません 。
したがって、情報源の範囲内では、中居氏の行為は 倫理的に問題がある可能性が高く、人権侵害やハラスメントに該当する可能性が高い と言えますが、 現時点で法的な意味での犯罪者であると断定する証拠はありません 。 」
「結局誰が一番悪い?」
「情報源とこれまでの会話を踏まえると、「結局誰が一番悪いか?」という問いに対して、 単一の個人を名指しすることは困難 であり、 複数の要因が複雑に絡み合っている と結論付けるのが適切です。しかし、責任の所在を考察する上で重要なポイントがいくつかあります。
まず、 個人の行為 としては、中居氏が女性Aに対して行ったとされる呼び出し 1 ... や、Q氏への接触行為[これまでの会話]は、ハラスメントに該当する可能性があり、これらの行為を行った 中居氏個人の責任 は否定できません。また、石原氏の関連会社女性社員に対するセクハラ行為 3 や、反町氏によるハラスメント疑惑 3 など、他の役職員によるハラスメント行為も報告されており、これらの行為者個人の責任も重大です。
しかし、本報告書は、 フジテレビ(CX)の組織としての問題点 を強く指摘しています。個々のハラスメント行為が発生し、適切に対処されなかった背景には、以下のような CXの組織的な責任 が大きいと考えられます。
•ハラスメントに対する認識の誤り : CX社内では、ハラスメント問題が当事者間の問題として捉えられ、会社として厳正に対処するという意識が欠如していました 4 。
•被害者の意思確認の不十分さ : 被害者がハラスメントを訴えづらい社内風土があり、表面的な被害者の意向のみを尊重し、適切な調査や処分が行われてきませんでした 5 ... 。
•ハラスメント被害の申告に対する対応の不十分さ : ハラスメント事案の一次対応が発生部署に委ねられ、適切な調査や救済が行われず、場当たり的な対応に終始していました 7 ... 。コンプライアンス窓口が機能していないという声も多数あります 9 。
•「性別・年齢・容姿などに着目して呼ばれる会合」の慣習 : 取引先の歓心を得るために、女性社員や女性アナウンサーが接待要員として動員されるような慣習があり、ハラスメントのリスクを高めていました 10 ... 。CXはこの慣習を通じて、取引先による人権侵害のリスクを「助長」していた可能性も指摘されています 13 ... 。
•経営陣の責任 : 本事案発生後、経営陣は客観的な調査を行わず、週刊誌報道を否定するような対応に終始し、ステークホルダーの信頼を失いました 14 ... 。人権侵害のリスクを認識しながら、適切な対策を講じてこなかった経営陣の責任は重大です 17 ... 。港社長をはじめとする編成ラインの幹部3名による閉鎖的な意思決定 19 や、危機管理の場面での不適切な行動 20 も問題視されています。
•コンプライアンス体制の不備 : コンプライアンス関連部署への情報共有が不十分であり 21 ... , リスクチェックシートの活用やモニタリングも不十分でした 24 ... 。内部通報窓口も実効性に欠けていました 27 ... 。
•組織風土 : セクハラを中心とするハラスメントに寛容な企業体質が形成され、女性の役員や上級管理職への登用が進まず、旧態依然とした組織風土が残存していました 14 ... 。
さらに、報告書は、 メディア・エンターテインメント業界全体の構造的な問題 にも言及しています 30 ... 。業界における権力構造や、人権意識の低さが、今回の問題の背景にある可能性も示唆されています。旧ジャニーズ事務所の問題 32 ... や、テラスハウス問題 23 ... など、過去の人権に関わる問題から十分に教訓を得ていなかったことも指摘されています。
結論として、「誰が一番悪いか」を特定することは難しいですが、 個々の加害者の責任に加え、ハラスメントを許容し、適切な対策を怠ってきたフジテレビ(CX)の組織としての責任が非常に大きい と言えます。また、より広い視点で見れば、 業界全体の構造的な問題 も根本的な原因の一つとして考慮されるべきです。」
どうでしょうか?
原文の方を読み込めていないのですが、あくまでアップしたソースに基づいた回答をしてくれているのと、きちんと引用先、参照先を示してくれているので安心感がありますし、そもそも一昨日発表された最新のソースについて生成AIが回答をしてくれるというのも素晴らしいところであります。
ちょっとおちゃらけた事例でお茶を濁してしまいましたが、
このGoolge NotebookLM、実はビジネスで大活躍するのです。
Goolgeの企業団体個人事業主向けのビジネスソリューションであるGoogle Workspaceですが、こちらのBusiness Standard(月額1496円/ID)以上のプランであれば、なんとGoogle NotebookLMの上位版であるGoogle NotebookLM Plusが使えちゃうのです。
無印のNotebookLMでも十分使えるのですが、ソースの数とサイズと回答数に制限があり、微妙に帯に短しというところがあります。タスキには全然長いんですけどね。
その制限がPlusになるとなんとそれぞれ5倍になり、通常使っている分にはほぼ制限の問題はなくなります。
あと、制限緩和以上に良いのが、作ったNotebookLMをGoogleワークスペース内の同僚などにグループアドレスで共有できちゃうことですね。
インターネットには公開できないような社内資料などをPDF化してアップすれば、社内ヘルプデスクみたいなものも簡単にできるし、今までの企画資料をぶち込んでしまえば、企画背景を知らないようなプロジェクト途中からの参画者の細かい疑問などにもGemini君が答えてくれちゃいます。
流石に社内の用語とか企画をググっておいてとは言えませんが、Google NotebookLMがあれば、あ、それならNotebookLMにまずは聞いておいて、と言えちゃうのです。
【使ってみて感じた、NotebookLMの『イケてない』点】
このように非常に便利なNotebookLMですが、実際に多くのソースを追加して使っていくと、いくつか「もう少しこうだったら良いのに」と感じる点、いわゆる『イケてない』点も見えてきました。
特にソースの数が増えてくると、その管理 がだんだん煩雑になってきます。NotebookLM本体のインターフェースでは、目的のソースを素早く探し出すための検索やフィルタリング機能が十分とは言えず 、特定のソースを見つけるのに苦労することがあります。また、プロジェクトの進行に伴って不要になったソースを一つ一つ手作業で削除 していくのも、数が多くなるとかなりの手間です。
さらに、リサーチ段階で集めた複数のWebサイトのURLや参考になるYouTube動画などをまとめてソースとして追加したい場合、現状では一件ずつ登録 する必要があり、非効率だと感じていました。ソースの名前も、追加した時点ではデフォルト名のままで、後から分かりやすい名前に変更 するのも一手間かかります。
【ソース管理の課題解決のために作ったChrome拡張機能】
こうしたNotebookLMのソース管理に関する煩わしさ、特に「ソースが増えたときの検索性、整理、一括操作の手間」を解決したいと考えました。NotebookLMの優れた分析・生成能力を最大限に活かすためには、その前段階であるソース管理がもっとスムーズであるべきだと思ったのです。
そこで、これらの課題を解決するために、Google Chromeの拡張機能「NotebookLM Source Manager 」を自分で開発しました。
この「NotebookLM Source Manager」は、NotebookLMのソース管理を強力にサポートする以下の機能を提供します。
高度なソース一覧表示とフィルタリング: NotebookLM本体では一覧性が低いソースリストを、拡張機能内で見やすく表示します。さらに、テキスト検索 はもちろん、正規表現 を使った複雑な検索や、ソースタイプ(Webサイト、PDF、YouTubeなど)での絞り込み が可能です。重複している可能性のあるソースをチェック する機能もあり、無駄なソースの整理に役立ちます。フィルタリングした結果はCSVファイルとしてダウンロード できるため、外部での管理や記録にも活用できます。
ソースの一括削除: 上記のフィルタリング機能と組み合わせることで、不要になったソース(例えば、重複チェックで見つかったソースや、特定のキーワードを含むソースなど)をリスト上で一括チェックし、まとめて削除 することができます。NotebookLM上で一つずつ削除する手間から解放されます。
URLの一括追加: リサーチ中にリストアップした複数のWebサイトURLやYouTube動画のURL を、テキストエリアに貼り付けるなどして一度の操作でNotebookLMにソースとして一括追加 できます。情報収集の効率が格段に向上します。
CSVを活用したソースの一括リネーム: まず、拡張機能のフィルタリング機能などを使い、名前を変更したいソースのリストをCSVファイルとしてダウンロード します。次に、ダウンロードしたCSVファイルをExcelやGoogle スプレッドシートなどの表計算ソフトで開き、ソース名の列を自由に編集 します(例えば、連番を付けたり、特定のキーワードを追加したり、個別に分かりやすい名前に変更したりできます)。編集が完了したら、そのCSVファイルを拡張機能に再度読み込ませる(※または指定の操作を行う)ことで、NotebookLM上の該当ソースの名前を一括で更新 します。これにより、手作業では面倒な大量のソース名の変更・整理を効率的に行うことができ、ソースリストの可読性を大幅に向上させます。
このように、「NotebookLM Source Manager 」を使うことで、NotebookLM本体だけでは手が届かなかったソース管理の『イケてない』部分を補い、より多くの情報を効率的に整理・活用できるようになります。NotebookLMの強力な分析・生成機能を、よりストレスなく、快適に利用するための心強いアシスタントとなるはずです。
秋山 大志
2025/04/02 07:30:00