123,123

OpenAI回應《紐約時報》侵權指控：沒有法律依據訓練數據來自公開渠道

人閱讀

2024-01-09 16:14:15

來源：TechWeb.com.cn
相關關鍵詞

1月9日消息，據外媒報道，在被《紐約時報》指控侵權后，OpenAI再次做出了公開回應。

據悉，為了訓練其強大的人工智能（AI）語言模型，OpenAI會利用從網絡收集來的大量數據，這些數據集包括維基百科文章、著名小說、社交媒體帖子等所有內容，而OpenAI沒有獲得任何許可。

微軟是OpenAI最大的支持者，它已在它的幾款產品中部署了OpenAI的人工智能工具。

2023年12月27日，《紐約時報》在聯邦法院對OpenAI及其最大的支持者微軟提起訴訟，聲稱這兩家公司未經許可就使用它的內容訓練人工智能模型，侵犯了它的版權。

《紐約時報》稱，這兩家公司非法使用其數百萬篇文章來訓練AI模型，導致其AI模型生成的內容現在與《紐約時報》的內容“直接競爭”。

在訴訟中，《紐約時報》的律師聲稱，《紐約時報》在與OpenAI就其內容的使用進行談判時尋求“公平價值”，但雙方未能達成協議。

針對《紐約時報》的侵權指控，OpenAI的知識產權和內容主管湯姆·魯賓（Tom Rubin）曾在當地時間1月4日表示，OpenAI對于《紐約時報》提出訴訟的選擇感到“驚訝”，因為在《紐約時報》起訴該公司之前，雙方正處于“非常積極和富有成效的談判中”。

日前，OpenAI方面再次對這起訴訟表態(tài)。該公司稱，《紐約時報》一直在文章的開頭提示GPT模型，導致模型產出的文本十分接近原文，從而增加了侵犯版權的可能性，這種操作違反了語言模型的使用條款。

魯賓也進一步指出，這些“提示”違反了該公司大模型的使用條款，《紐約時報》在故意利用這些“提示”讓大模型復制訓練數據。

當地時間周一，OpenAI發(fā)布聲明再次做出回應。該公司強調，《紐約時報》提起的訴訟“沒有法律依據”，且沒有講述完整事實。盡管如此，該公司仍希望與《紐約時報》建立建設性的合作伙伴關系，并尊重其悠久的歷史。

OpenAI在聲明中表示，使用公開可用的互聯網材料訓練AI模型是合理使用，這一點得到了被長期和廣泛接受的先例的支持。但該公司也為出版商提供了退出選項，以防止OpenAI的工具訪問他們的網站。

此外，該公司還表示，“重復”是該公司正在努力徹底消除的罕見錯誤?！啊都~約時報》引出的重復內容似乎來自于多年前在多個第三方網站上廣泛傳播的文章。他們似乎故意操縱提示，通常包括冗長的文章摘錄，以使我們的模型重復。即使使用這樣的提示，我們的模型通常也不會像《紐約時報》暗示的那樣表現，這表明他們要么指示模型重復，要么從多次嘗試中挑選出他們的例子。”

在被《紐約時報》起訴后，OpenAI曾在上周表示，它正與數十家出版商洽談版權合作事宜。消息人士稱，OpenAI愿意每年向一些媒體公司提供100萬至500萬美元的費用，以獲得將版權內容用于訓練其大模型的許可。（小狐貍）

（免責聲明：本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網站出現的信息，均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時，應及時向本網站提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后，將會依法盡快聯系相關文章源頭核實，溝通刪除相關內容或斷開相關鏈接。）