科技報導 [第519期]:大型語言模型的訓練素材從哪裡來?

點閱:1

並列題名:SciTech reports

作者:科技報導

出版年:2025.03

出版社:科技報導雜誌社

出版地:臺北市

最新發刊 : 2025-03-15

雜誌類型 : 月刊



雜誌簡介: 《科學月刊》的姊妹刊物《科技報導》(SciTech Reports),系周成功於1981年10月創辦,每月15日發刊,內容以報導與評論為主。

本期內容簡介

大型語言模型的訓練素材從哪裡來?

伴隨人工智慧(artificial intelligence, AI)與大型語言模型(large language model, LLM)的蓬勃發展,各大語言模型所需的訓練素材來源也逐漸受到眾人關注。訓練LLM需要使用龐大素材,現今網路資料如洪流,各公司如何從中擷取有用的材料?是否會衍伸著作權問題?合理使用的界線又該劃在哪裡?當LLM的研發與使用成本漸漸降低,如何確保訓練素材的開放性與高品質,或許將成為LLM能否平民化的關鍵。
雜誌簡介

《科學月刊》的姊妹刊物《科技報導》(SciTech Reports),系周成功於1981年10月創辦,每月15日發刊,內容以報導與評論為主。
  • 焦點話題 讓大型語言模型蓬勃發展 資料與技術的開放、協力、自主(p.2)
  • 科技人文 如何創造城市礦源?循環經濟的鋰離子電池再回收技術(p.8)
  • 專訪時間 引領益生菌創新浪潮 雷文虎克生物技術股份有限公司創辦人暨執行長徐丞志專訪(p.13)
  • 書適圈 谷歌會喝掉我家用的水嗎?《血汗AI:為人工智慧提供動力的隱性人類勞工》(p.16)