セマンティック・データマイニング
LLM×統計×機械学習
LLM(大規模言語モデル)の本質を「意味」を計算可能にした技術革新と捉えることができます。従来は、不定形な定性情報は、定量分析とは相いれないものだと考えられ続けてきましたが、LLMの登場により大きくその状況が変わりました。今、我々は統計解析や機械学習などの結果をLLMによってパワフルに解釈することができるだけでなく、不定形な定性情報をベクトル化して、機械学習により定量的に分析することすら可能になっています。
コンセプト・マッピング
コールセンターでの「顧客の声」や技術論文、ニュース記事、特許情報などのテキスト情報をセグメント化し、RAGシステムや将来のコーポレート・エージェント・システムを安全に運用する基盤を構築する。
知的アンサンブル・モデル
機械学習プロジェクトで成果を出すには、異なる手法を組み合わせて複数のモデルを作成し、データ空間内で最適モデルを割り当てて実行すること。各モデルのローカルな性能を評価する手法を提供。
Viscovery SOMine
世界最先端のSOMデータマイニング・テクノロジー。1997年に統計互換型SOMの完全実装から始まり、2000年、SOM-Wardクラスタリング、2003年、強力なプロファイル分析、SOMローカル回帰法、2023年にはSOM密度ベース・クラスタリング、確率SOMなどの独自手法を次々と世に送り出してきた。世界最大の自動車メーカーが長年、世界市場戦略の策定に活用し続けている。
Hugin
ベイジアン信念ネットワーク(BBN)を世界で初めて実用化したのは、デンマークのアーボーク大学で考案された’ジャンクション・ツリー’と呼ばれる確率伝播方式だった。以来、HuginはBBNの技術開発の先頭を走ってきた。保険、金融、法医学、製造、ヘルスケア、エネルギー開発などの分野で広く利用されている。最先端のマーケティングでは、シナリオを仮定した人工の市場データ生成にも利用される。
PyStat
Pythonの統計および機械学習ライブラリをGUIで利用する実験プロジェクト。