ケーススタディ:日立製作所で「ChatGPT×社内外データ」を使って埋もれた人材を発掘し、ロボティクス新規PJを最速で起動する
ChatGPT 4o + Deep ReseachやGemini Pro 2.5 + Deep Reseachを使って無数の調査報告書を作成してきました。資料の探索→内容咀嚼→分析→報告書執筆ではこれに勝るツールは歴史的に存在しなかったということはよくわかります。調査屋だったので。
最近発見したのは『人を見つけ出す能力』でも頭抜けたパフォーマンスを発揮するということです。以下ではリアリティを持った理解をしていただけるように、大きなテクノロジー系企業の代表格ということで日立製作所において、ロボティクス関連の新規プロジェクトを立ち上げる場合を想定して、『埋もれた人材を探す』具体的な手順を述べます。
様々な応用が可能なので、ぜひ、試してみて下さい。なお、セキュリティ保持の必要があるため、社内でMicrosoft Azureを導入しており、Azure上でChatGPTを動かす前提で述べています。
この方法論は、ヘッドハンティング会社がIT系の人材を探す際にも使えますし、総合商社の経験者をヘッドハンティングする際にも使えると思います。主だった人々はネットに活躍の痕跡が残っていますから。(オープンなインターネットでChatGPT 5を活用して人材を探すことができます)
イントロ:なぜ、いま"人材探索RAG"なのか
日立製作所クラスの大企業では、社内に眠る実装派エンジニアと、社外で静かに発信を続ける原石が相当数います。この投稿では、ロボティクスの新規プロジェクト(例:ROS2×Isaac Sim×Jetson Orin×SLAM)を3か月で立ち上げるケースを想定して、ChatGPTを活用するとどういう効率的な人材発掘ができるのか?をケーススタディとして記述します。「誰を招集すべきか」を最短で見極める仕組みを考えます。
日立製作所を明示したケースとして、Azure上に**人材発掘RAG(Retrieval-Augmented Generation)**を構築し、社内×社外の二面作戦で"埋もれ人材"を可視化する実戦手順をまとめます。
全体像:アーキテクチャの結論(閉域×検索×生成)
-
ネットワーク:Azure OpenAI / Azure AI Search / Blob(またはData Lake)をVNet+Private Endpointで閉域化。社内からはExpressRoute/サイト間VPN経由で到達。Microsoft Learn
-
検索の心臓部:Azure AI Searchに「全文(BM25)+ベクトル(埋め込み)」をハイブリッド検索として統合し、Semantic Ranker+RRFで再ランク。自然文でも技術語でも強い。Microsoft Learn+2Microsoft Learn+2
-
生成(要約・カード化):Azure OpenAIのGPT-4系を**"On Your Data"**で利用。根拠スニペットや出典URLを必ず同梱。Microsoft Learn
-
プライバシー:Azure OpenAI(エンタープライズ)は学習目的でのデータ利用を行わない運用が明示され、企業向けのデータ保護条件下で提供。Microsoft Learn
埋め込みモデル推奨:候補者のドキュメント・PR・発表資料をtext-embedding-3-largeでベクトル化(高精度・多言語)。OpenAI Platform+1
想定するプロジェクト前提(Hitachi Robotics PoC)
-
テーマ:ROS2+Isaac Sim+Jetson Orinで屋内自律移動(SLAM+Nav2)PoCを3か月で実装
-
ユースケース例:
-
工場・倉庫:ライン間搬送、棚間ナビゲーション、巡回点検
-
建設・プラント:屋内マップ生成、定点監視
-
オフィス・商業施設:夜間巡回、案内(モバイル主体)
-
社内プレイブック(日立イントラ側)--"眠る宝"を48時間で可視化
情報ソース(例):
特許・発明届、社内OSS/GitHub Enterprise、技報/論文、Confluence/SharePoint、Teams/Slack、研修・登壇台帳、HRスキル台帳(PII最小化)
横断クエリ(検索プロファイル)
"Isaac Sim" OR "Omniverse" OR "ROS2" OR "Nav2" OR "slam_toolbox" OR "ORB-SLAM3" OR "Jetson Orin" OR "VIO" OR "LiDAR"
-
係数ブースト:近3年×1.4/社外登壇×1.2/特許×1.1(メタデータで付与)
-
ハイブリッド検索:
search
(全文)+vectors
(埋め込みクエリ)を同一リクエストで実行→RRF+Semantic Rankerで統合。Microsoft Learn+1
スコアリング(100点:LLMは説明だけ、判定は数式)
-
ドメイン合致(ROS2/Isaac/SLAM/Jetson)......40
-
実装深度(コード/PoC/製品導入)......25
-
近接性(事業/拠点/過去協業)......10
-
可用性(アサイン可能性)......10
-
協働指標(レビュー/メンタリング)......10
-
コンプライアンス(輸出管理・守秘)......5
運用ステップ(最短)
-
PJ要件→キーワード化(30分)
-
社内横断クエリ→上位50名抽出(半日)
-
15分スクリーニング面談→8〜12名へ(2日)
-
2時間デザインスプリント→5〜8名に確定(3日目)
-
上長合意・アサイン打診テンプレを一括送付
候補者カード(自動生成の型)
-
氏名/部署/拠点/役割候補
-
強み:ROS2 Nav2/Isaac(4.x)/slam_toolbox/Jetson最適化
-
根拠スニペット&URL(社内文書ID可)
-
直近アウトプットの新しさ(例:2025-05更新)
-
アサイン案(期間・稼働率)/留意(NDA・輸出管理)
社外プレイブック(公開発信から"原石"を拾う)
主戦場:Zenn、Qiita、connpass(ROS Japan UGなど)、企業Techブログ、GitHub、X/YouTube、出版社サイト・著者ブログ
実査の目印(シグナル)
-
テーマ一致(ROS2/Isaac/SLAM/Jetson)、最新性(≤12か月)、再現性(手順・罠・コード)、継続発信、登壇/書籍実績
-
GitHubはtopic: ros2 / isaac-sim / slam_toolbox+日本語README/JST時間帯commitを目視
検索ヒント
-
site:zenn.dev "Isaac Sim"
、site:qiita.com "ROS2" "slam_toolbox"
(新しい順) -
connpass発表者→資料・動画トレース(登壇×1.2でブースト)
Try→Buyの安全運用
-
公開記事の再現課題をミニテスト化→短期契約→本契約。
-
本人の公開実績をポートフォリオとして残せる設計で打診すると受諾率が上がる。
データ&ネットワーク設計(ガバナンス最優先)
-
閉域:Azure OpenAI/AI Search/Storage を同一VNetに配置、Private Endpointで到達。社内からはExpressRoute等で接続。Microsoft Learn
-
On Your Data:既存インデクスに対してRAGを提供し、根拠提示を標準化。RBACで閲覧範囲を制御。Microsoft Learn+1
-
データ保護:Azure OpenAIの企業向けデータ処理ポリシーに準拠(学習用途への不利用)。Microsoft Learn
14日PoCロードマップ(Hitachi版)
Day 1-3|インデクス構築
-
対象は3系統に絞る:GitHub Enterprise/Confluence/特許DB
-
文書を1-2kトークンでチャンク化→text-embedding-3-largeで埋め込み→AI Searchへ投入(vector+keywordスキーマ)OpenAI PlatformMicrosoft Learn
Day 4-6|検索プロファイル整備
-
代表クエリをプロファイル化:
-
"Isaac Sim" "Omniverse" "ROS2" "Nav2" "slam_toolbox" "ORB-SLAM3" "Jetson Orin" "VIO" "LiDAR"
-
-
RRF+Semantic Rankerを既定ON、係数(近3年/登壇/特許)をメタで加点。Microsoft Learn+1
Day 7-10|抽出・要約パイプライン
-
GPT-4系で候補者カードJSON生成(skills[]、evidence[]、recency_score、suggested_role)
-
RAGで根拠スニペットと最終更新日を差し込み
Day 11-14|UXと統制
-
Power BI/社内ポータルでランキング表示(クリックで根拠、ダブルクリックで上長打診テンプレ)
-
監査ログ(誰が誰を検索/閲覧したか)とオプトアウト導線
実際に使うクエリ&バリアント(コピペOK)
-
基軸(屋内移動×Sim2Real)
("Isaac Sim" OR "Omniverse") AND (ROS2 OR "Nav2") AND (SLAM OR "slam_toolbox" OR "ORB-SLAM3") AND ("Jetson Orin" OR VIO OR LiDAR)
-
アーム併用:
("MoveIt2" OR "Isaac Manipulator")
追加 -
Unity派/Gazebo派:
("Unity Robotics" OR "Gazebo" OR "Webots")
置換 -
非NVIDIAエッジ:
("Intel NUC" OR "Ryzen Embedded" OR "x86 ROS2")
追加
バイアス対策・コンプライアンス
-
非使用属性:部署・性別・年齢等のプロテクト属性はスコアに一切使用しない
-
コンテンツ量バイアス(発信多い人が有利)対策:再現課題で公平化
-
目的外検索の禁止:監査ログ+用途合意を明文化
-
輸出管理・機微情報:カード展開前に自動マスキング/アクセス要件を定義
期待インパクト(KPIイメージ)
-
候補者一次抽出:半日で50名
-
最終絞り込み:3営業日で5〜8名
-
PoC開始までのリードタイム:従来比−50〜70%
-
社外連携:再現課題→2週間以内に短期契約、到達速度を可視化
よくある誤解と回避策
-
「ChatGPT(公開版)を社内に入れるの?」
→ No。Azure OpenAIを閉域で使い、**"On Your Data"**で根拠付きの回答を返す。Microsoft Learn+1 -
「検索はベクトル一択?」
→ ハイブリッドが最適。全文+ベクトルをRRF+Semantic Rankerで統合するのが安定。Microsoft Learn+1 -
「LLMに最終判定させる?」
→ しない。LLMは説明・要約・カード整形まで。最終スコアは数式で明示。