招標公告(2017-03-13)

財團法人智榮文教基金會「兩岸趨前消費者文本分析暨大數據應用研究計畫」採購規格

一、 請購案名:兩岸趨前消費者文本分析暨大數據應用研究計畫
二、 預算金額:新台幣550,000元(含稅)
三、 廠商資格、採購背景(用途)及環境說明:

(一)廠商資格
依中華民國法令設立之法人或自然人機構,具健康大數據資料及大數據分析能力者 (應附相關能力證明)。

(二)採購背景 (用途)

  1. 本會執行之質性研究,累積大量的深度訪談資料,需使用語意分析資料庫的技術,協助研究院進行訪談資料的自動化文本分析。
  2. 文本分析除了文本分類、分詞、分句等基本分析之外,尚需仰賴長期累積之特定領域專家詞彙資料庫,並與人工分析交叉驗證,進行屬性詞擷取、文本自動摘要等,以達文本語意分析之目的。

(三)環境說明:無

四、功能規範/應提供或製作文件/工作項目
(一)建構用戶詞典

  1. 工作內容:構建台灣和中國大陸的近義詞語料庫,維護健康、科技等領域的語料庫。
  2. 技術手段:基於R套件開發包含正體與簡體自動轉換的函數。
  3. 詞典涵蓋範疇(coverage)經雙方討論與調教,人工定義領域的關鍵詞彙涵蓋率達80%。

(二)發展自動標籤系統

  1. 工作內容:基於本會所累積之文本語料與分析邏輯,應用文字探勘技術,開發語意打標籤的工具。
  2. 技術手段:基於R套件開發有監督的機器學習模型與無監督的機器學習模型,其中無監督機器學習採Force alarm 模式。
  3. 基於 Shiny 的系統,可以讀入任意文本輸出標籤的介面設計。

(三)交付文件

  1. 用戶詞典
  2. 自動標籤的機器學習模型
  3. 網路文本分析輸入與輸出操作介面
  4. 模式校正說明與系統使用說明書

(二) 權利義務分配:本計畫工作項目成果,包含近義詞詞典與自動標籤的機器學習模型之智慧財產權均屬智榮基金會所有。

(三) 服務建議書建議格式及內容

1.服務建議書格式

(1). 規格:A4大小
(2). 繕打及裝訂:有左至右橫式打印,加註頁碼、封面、雙面列印,以左側裝訂成冊,封面註明廠商名稱、本案名稱及日期。
(3). 各冊文件計2份。依前項規定內容製作一式2份正本(企劃書之格式、完整性、內容、份數等不作為資格審查之依據,但不受理補件)。

2.服務建議書內容(配合評分項目,例示如下)

(1)廠商(含合作廠商)簡介,人力規模、組織編制、中文自然語言處理能力,語意分析資料庫實績、並請檢附相關證明文件(影本)。
(2)廠商營利事業證明或成立文件。
(3) 委辦事項內容規劃說明

A. 文本資料分析執行說明。
B. 文字探勘分析模式及使用方式說明。
C. 專案管理及規劃人員分工及權責。請詳列本案主要策劃、執行人員,以及預計投入本案人員簡介(如姓名、學歷、經歷等)及如何人力分工(含分工職掌、人力配置及人員簡歷);如有專業證照請檢附相關證明文件。

(4)各階段作業程序及進度安排 (請以甘特圖表示)。
(5)預估費用:預估本案所需各項明細費用。
(6)其他:由廠商視需要補充說明。

五、幣別、付款方式及條件
投標幣別:臺幣
付款幣別:臺幣
付款條件:本案分二期支付。
第一期款:簽約完成且完成資料庫建置前置作業,經確認無誤後給付(50%)。
第二期款:經驗收與確認無誤後給付(50%)。

七、履約期限
2017年9月31日前完成(繳交驗收項目)。

八、驗收項目

  1. 用戶詞典
  2. 詞典coverage達80%
  3. 含機器學習模型的R套件
  4. 基於Shiny系統的讀入與輸出操作介面
    模式校正說明與系統使用說明

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *