ナレッジベース構築プラットフォーム「Toposoid」が画像に対応。文章の曖昧性を画像で補う推論技術も搭載。
[24/02/26]
提供元:PRTIMES
提供元:PRTIMES
〜マルチモーダルAIを搭載したナレッジベース〜
[画像1: https://prcdn.freetls.fastly.net/release_image/87522/10/87522-10-4c478814b1841e6853d8a24c0fae4ff1-2172x1288.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「Toposoid」上で曖昧検索し、関連する画像とテキストのナレッジグラフを出力した様子
Linked Ideal合同会社(本社:東京都立川市、代表社員:久保寺誠)は、画像に対応したナレッジベース構築プラットフォーム「Toposoid」バージョン0.5を、2024年2月22日(木)にオープンソースソフトウェアとして公開致しました。
URL: https://toposoid.com
OSSのURL: https://github.com/toposoid/toposoid
■文章の曖昧性を画像で補う推論技術とは?
例えば、次の二つの文章があったとします。
- 猫が2匹寝てます。
- ペットが2匹寝てます。
推論する際、ペットは猫とは限らないのでこれら二つの文章を同一視することには無理があります。しかし、次のような状況ではどうでしょうか?
[画像2: https://prcdn.freetls.fastly.net/release_image/87522/10/87522-10-4a50a6879d59b24b10b6b367f350c434-1692x650.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「Toposoid」での文章の曖昧性を画像で補う推論技術
この場合、画像からペットが猫であること、そしてその猫がほぼ同じ画像であることからこの二つの文章を同一視することができます。今回「Toposoid」は、画像とテキストの両方をナレッジベース上で扱える機能拡張を行い、文章の曖昧性を画像で補うことでより高度なマッチングを実現しました。
■ テキストと画像を登録、検索、推論できるナレッジベース
今回のバージョンアップでは、ナレッジベース上で画像が扱いやすいようUIを強化致しました。
- 文章に画像を紐づける直観的なUIを提供
[画像3: https://prcdn.freetls.fastly.net/release_image/87522/10/87522-10-d4a4144c04fd545f538d31fa1a529c5f-3504x1632.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「Toposoid」での画像を文章に紐付けながらナレッジベースに登録
- 画像からもテキストから入力可能な曖昧検索UIを提供
[画像4: https://prcdn.freetls.fastly.net/release_image/87522/10/87522-10-3c472b5d29de16f39a0e6b7ab25f0004-3548x1856.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「Toposoid」での画像やテキストなどからの曖昧検索
■ 今後の抱負
昨今、フェイクニュースが社会問題となってきております。2024年早々にも能登半島地震でのフェイク情報拡散や、台湾総統選挙でも他国によるフェイク情報拡散など被害は年々エスカレートしております。そして世界経済フォーラム(WEF)は、「Global Risks Report 2024」の中で、AIによる誤情報が社会の結束に与える影響が最も大きなグローバルリスクになると警告しました。「Toposoid」はナレッジベースを検索するだけではなく、何故それが正しいのかを説明できる仮定や情報も合わせて推論結果を返すように設計されています。私達は今後も鋭意機能拡張を進めていき「Toposoid」の精度を高め、フェイク情報拡散防止の一助を担えるような社会貢献につなげたいと考えております。
■ 用語説明
マルチモーダルAIは、テキスト、音声、画像、動画、センサ情報など、2つ以上の異なるモダリティ(データの種類)から情報を収集し、それらを統合して処理する人工知能(AI)システムです。 異なるモダリティの情報を組み合わせることによって、より豊かな情報を処理し、より深い理解や洞察を提供することができます。
■ 参考資料
世界経済フォーラム(WEF)「Global Risks Report 2024」
https://jp.weforum.org/publications/global-risks-report-2024/■ 【会社概要】
会社名:Linked Ideal合同会社
所在地:東京都立川市錦町1-4-4 サニービル2F CS-109
代表社員:久保寺誠
設立:2021年4月
事業内容:人工知能を活用したデータ分析
URL:https://linked-ideal.com/
Toposoidへのお問合せ: https://toposoid.com/contct
会社へお問合せ: https://linked-ideal.com/contact
[画像1: https://prcdn.freetls.fastly.net/release_image/87522/10/87522-10-4c478814b1841e6853d8a24c0fae4ff1-2172x1288.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「Toposoid」上で曖昧検索し、関連する画像とテキストのナレッジグラフを出力した様子
Linked Ideal合同会社(本社:東京都立川市、代表社員:久保寺誠)は、画像に対応したナレッジベース構築プラットフォーム「Toposoid」バージョン0.5を、2024年2月22日(木)にオープンソースソフトウェアとして公開致しました。
URL: https://toposoid.com
OSSのURL: https://github.com/toposoid/toposoid
■文章の曖昧性を画像で補う推論技術とは?
例えば、次の二つの文章があったとします。
- 猫が2匹寝てます。
- ペットが2匹寝てます。
推論する際、ペットは猫とは限らないのでこれら二つの文章を同一視することには無理があります。しかし、次のような状況ではどうでしょうか?
[画像2: https://prcdn.freetls.fastly.net/release_image/87522/10/87522-10-4a50a6879d59b24b10b6b367f350c434-1692x650.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「Toposoid」での文章の曖昧性を画像で補う推論技術
この場合、画像からペットが猫であること、そしてその猫がほぼ同じ画像であることからこの二つの文章を同一視することができます。今回「Toposoid」は、画像とテキストの両方をナレッジベース上で扱える機能拡張を行い、文章の曖昧性を画像で補うことでより高度なマッチングを実現しました。
■ テキストと画像を登録、検索、推論できるナレッジベース
今回のバージョンアップでは、ナレッジベース上で画像が扱いやすいようUIを強化致しました。
- 文章に画像を紐づける直観的なUIを提供
[画像3: https://prcdn.freetls.fastly.net/release_image/87522/10/87522-10-d4a4144c04fd545f538d31fa1a529c5f-3504x1632.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「Toposoid」での画像を文章に紐付けながらナレッジベースに登録
- 画像からもテキストから入力可能な曖昧検索UIを提供
[画像4: https://prcdn.freetls.fastly.net/release_image/87522/10/87522-10-3c472b5d29de16f39a0e6b7ab25f0004-3548x1856.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「Toposoid」での画像やテキストなどからの曖昧検索
■ 今後の抱負
昨今、フェイクニュースが社会問題となってきております。2024年早々にも能登半島地震でのフェイク情報拡散や、台湾総統選挙でも他国によるフェイク情報拡散など被害は年々エスカレートしております。そして世界経済フォーラム(WEF)は、「Global Risks Report 2024」の中で、AIによる誤情報が社会の結束に与える影響が最も大きなグローバルリスクになると警告しました。「Toposoid」はナレッジベースを検索するだけではなく、何故それが正しいのかを説明できる仮定や情報も合わせて推論結果を返すように設計されています。私達は今後も鋭意機能拡張を進めていき「Toposoid」の精度を高め、フェイク情報拡散防止の一助を担えるような社会貢献につなげたいと考えております。
■ 用語説明
マルチモーダルAIは、テキスト、音声、画像、動画、センサ情報など、2つ以上の異なるモダリティ(データの種類)から情報を収集し、それらを統合して処理する人工知能(AI)システムです。 異なるモダリティの情報を組み合わせることによって、より豊かな情報を処理し、より深い理解や洞察を提供することができます。
■ 参考資料
世界経済フォーラム(WEF)「Global Risks Report 2024」
https://jp.weforum.org/publications/global-risks-report-2024/■ 【会社概要】
会社名:Linked Ideal合同会社
所在地:東京都立川市錦町1-4-4 サニービル2F CS-109
代表社員:久保寺誠
設立:2021年4月
事業内容:人工知能を活用したデータ分析
URL:https://linked-ideal.com/
Toposoidへのお問合せ: https://toposoid.com/contct
会社へお問合せ: https://linked-ideal.com/contact