掃一掃在手機打開當前頁
在2024世界智能產業博覽會召開首日,市數據局在國家會展中心(天津)舉辦天津市第一批行業高質量數據集發布活動,信創海河實驗室受邀出席現場發布。高質量數據集是人工智能模型訓練、推理和驗證的關鍵基礎。此次活動上,37家企事業單位共80個數據集公開發布,覆蓋工業制造、交通運輸、科技創新、文化旅游、醫療健康、城市治理等12個重點領域。其中69個數據集為國內首次公開發布,14個數據集已應用支撐各類天津市自研大模型。
實驗室本次共發布了“兒科下顎智齒牙胚分割數據集 NKUT”、“科技類基礎教育教輔教材數據集”、“國內主流年鑒文本數據集”及各類語種數據集等共12項,包含文本、圖片、音頻等多種模態,主要支撐于智慧醫療、科普教育等多項應用場景的大模型。
下一步,信創海河實驗室將繼續發揮平臺優勢,持續整合通用行業數據資源,加速提升數據供給能力,努力開發更多細分領域數據集,為加快行業高質量數據集發展貢獻力量。