以 LLM&VLM 為核心打造影像查詢流程:簡化 Dify 流程設計、讓非工程人員也能上手一般領域
亮點功能:
本專案利用大型語言模型(LLM)與視覺語言模型( VLM )作為核心邏輯推理引擎,結合 Dify 平台,設計一套可供非工程背景使用者輕鬆上手的影像查詢流程。透過語言模型自動解析指令、組合 API 呼叫、推論影像資料庫內容,實現「自然語言→視覺搜尋→可視化回應」的查詢體驗。整體流程透過模組化設計,簡化流程設計與部署難度。
預期效益:
- 支援多種大型語言模型與多模態模型,提升語意理解與影像解析能力
- 查詢流程圖形化拖拉設計,非工程人員也能快速部署
- 系統可結合語意嵌入、圖片相似度搜尋與文字生成,完成從詢問到回答的整合
- 提供影像說明、分類、比對等多種模組化節點
服務客群:
品保部門、現場操作人員、業務支援團隊
點我進入: