本期內容簡介
大型語言模型的訓練素材從哪裡來?
伴隨人工智慧(artificial intelligence, AI)與大型語言模型(large language model, LLM)的蓬勃發展,各大語言模型所需的訓練素材來源也逐漸受到眾人關注。訓練LLM需要使用龐大素材,現今網路資料如洪流,各公司如何從中擷取有用的材料?是否會衍伸著作權問題?合理使用的界線又該劃在哪裡?當LLM的研發與使用成本漸漸降低,如何確保訓練素材的開放性與高品質,或許將成為LLM能否平民化的關鍵。
大型語言模型的訓練素材從哪裡來?
伴隨人工智慧(artificial intelligence, AI)與大型語言模型(large language model, LLM)的蓬勃發展,各大語言模型所需的訓練素材來源也逐漸受到眾人關注。訓練LLM需要使用龐大素材,現今網路資料如洪流,各公司如何從中擷取有用的材料?是否會衍伸著作權問題?合理使用的界線又該劃在哪裡?當LLM的研發與使用成本漸漸降低,如何確保訓練素材的開放性與高品質,或許將成為LLM能否平民化的關鍵。
同書類書籍