數據是訓練AI能力的“原料”之一。在第八屆數字中國建設峰會29日舉行的“高質量數據集和數據標注”主題交流活動上,由國家數據局指導的全國數據標準化技術委員會提出,將強化標準引領,分三類建設高質量數據集。一類為“通識數據集”,包含面向社會公眾、無需專業(yè)背景即可理解的通用知識,主要用于支撐通用模型落地應用。一類為“行業(yè)通識數據集”,包含面向行業(yè)從業(yè)人員、需要一定專業(yè)背景才能理解的行業(yè)領域通用知識,主要用于支撐行業(yè)模型落地應用。一類為“行業(yè)專識數據集”,包含面向特定業(yè)務場景相關人員、需要較深的專業(yè)背景才能理解的行業(yè)領域專業(yè)知識,主要用于支撐業(yè)務場景模型落地應用。簡單舉例,互聯(lián)網百科、問答等為“通識數據集”;行業(yè)研究機構報告等為“行業(yè)通識數據集”;醫(yī)院科室特定疾病病例等為“行業(yè)專識數據集”。國家數據局相關負責人表示,從發(fā)展趨勢來看,人工智能模型對數據集的需求正從“通用知識”向“專業(yè)知識”延伸拓展,經過專家精細化標注的數據集已成為AI價值實現過程中不可或缺的基石,下一步將積極引導做好高質量數據集和數據標注建設工作,為人工智能技術創(chuàng)新和產業(yè)應用提供堅實的數據基礎。
特別聲明:智慧醫(yī)療網轉載其他網站內容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點或證實其描述,內容僅供參考。版權歸原作者所有,若有侵權,請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網的內容為智慧醫(yī)療網原創(chuàng),轉載需獲授權。