Trí tuệ nhân tạo và cuộc chiến chưa có hồi kết

Sự phát triển của trí tuệ nhân tạo và vai trò ngày càng tăng của nó trong mọi lĩnh vực kinh tế - xã hội đã mở ra cơ hội cho những cuộc tranh luận gay gắt về các vấn đề pháp lý…

Mặc dù công nghệ trí tuệ nhân tạo (AI) đã xuất hiện từ những thập kỷ trước nhưng chỉ đến gần đây, sự bùng nổ của các công cụ AI tạo sinh như ChatGPT và DALL-E 2 mới thu hút được sự chú ý của cả thế giới. Hiểu một cách cụ thể, AI tạo sinh là một nhánh của trí tuệ nhân tạo tập trung vào việc tạo ra nội dung được cá nhân hóa như hình ảnh, âm thanh, văn bản hoặc mã dựa trên mô tả văn bản, lời nhắc hoặc mệnh lệnh. Đây cũng là một trong những chủ đề được quan tâm nhất trong thời gian qua.

AI học rất nhanh

Nền tảng cho sự phát triển và vận hành của hầu hết các công cụ AI tạo sinh liên quan tới một khái niệm được gọi là máy học (machine learning).

Máy học là một lĩnh vực cốt lõi của AI, trong đó một chương trình máy tính có thể tự học và phát triển trong quá trình này.

Giống như cách con người học hỏi thông qua kiến thức, một phần mềm AI có thể được tạo ra để học hỏi thông qua kinh nghiệm và ví dụ. Quá trình này được điều phối bởi mạng lưới thần kinh (neural network), cách nói khác của việc các phần mềm cố gắng bắt chước cách hoạt động của bộ não con người thông qua một bộ thuật toán.

Trong các phiên bản nâng cao hơn, những hệ thống này sử dụng các kỹ thuật được gọi là học sâu (deep learning), khi đó máy có thể học cách xử lý bất kỳ đầu vào (input) cụ thể nào và đưa ra đầu ra (output) dự đoán nhờ vào nhiều lớp mạng nơ-ron và hàng triệu ví dụ cùng lượng dữ liệu đào tạo có sẵn.

Chính vì sự vượt trội đó, mà học sâu yêu cầu bộ dữ liệu cực lớn để đào tạo AI. Internet rõ ràng là một kho dữ liệu văn bản và hình ảnh khổng lồ, do đó, đây là nguồn tài nguyên màu mỡ mà các nhà phát triển thường sử dụng để thu thập thông tin, tài liệu đào tạo cho các phần mềm AI của họ.

Về lý thuyết, các hệ thống AI tạo sinh không nhằm mục đích tái tạo nguyên văn dữ liệu đào tạo của chúng. Những hệ thống này sử dụng nội dung hiện có như một phần của quá trình học hỏi, từ đó xây dựng nên một định hình đầu ra (output) của sản phẩm.

Trí tuệ nhân tạo

Mục tiêu lý tưởng nhất mà các nhà lập trình đặt ra đối với AI tạo sinh hiện nay là các hệ thống này hoạt động giống như một tác giả con người quen thuộc với bối cảnh văn hóa và tạo ra tác phẩm riêng lấy cảm hứng từ bối cảnh đó, nhưng không chiếm đoạt bất kỳ chi tiết cụ thể nào từ các tác phẩm đã có trước đó.

Trí tuệ nhân tạo và "vùng xám" pháp lý

Bất kể những lời hứa hẹn của các nhà lập trình công nghệ, nhiều người vẫn khẳng định AI chỉ đang tổng hợp và sao chép ý tưởng của con người và hoàn toàn không có tính nguyên bản.

Họ lập luận việc áp dụng các kỹ thuật máy học làm tăng nguy cơ vi phạm bản quyền tiềm ẩn ở hai điểm: (i) sử dụng các tác phẩm hiện có làm dữ liệu gốc và (ii) việc ghi nhớ các yếu tố của tác phẩm hiện có như một phần của tác phẩm mới được tạo ra.

Về cơ bản, bản quyền được trao cho chủ sở hữu tác phẩm quyền thực hiện một số hành vi nhất định đối với tác phẩm đó. Ví dụ trong văn học nghệ thuật, các quyền này bao gồm quyền sao chép tác phẩm, xuất bản tác phẩm hoặc truyền đạt tác phẩm tới công chúng. Chủ sở hữu tác phẩm văn học cũng có thể độc quyền chuyển thể tác phẩm đó, chẳng hạn như dịch tác phẩm sang ngôn ngữ khác hoặc viết kịch bản dựa trên tác phẩm. Do vây, bất kỳ ai thực hiện hoặc cho phép thực hiện bất kỳ hành vi nào nói trên mà không có giấy phép của chủ sở hữu bản quyền là vi phạm bản quyền.

Theo góc nhìn pháp lý, việc sản xuất một sản phẩm AI tạo sinh sẽ là vi phạm bản quyền nếu nó sao chép một phần quan trọng của bất kỳ tác phẩm gốc nào, dù cho có thể không nhiều về mặt nội dung nhưng lại có ý nghĩa hoặc đáng nhớ.

Đã có nhiều mánh khoé đã được sử dụng trong quá trình áp dụng công nghệ AI, nổi bật là xu hướng tạo ra các tác phẩm mới theo phong cách của một tác giả hoặc nghệ sĩ thực. Trên các hệ thống phức tạp, các điều lệnh như viết lời cho một bài hát theo phong cách của Taylor Swift hoặc vẽ một bức tranh theo phong cách của Picasso có thể tạo ra kết quả trông chân thực đáng kinh ngạc.

Hiện nay, bắt chước phong cách đặc trưng của một nghệ sĩ vẫn nằm trong vùng xám pháp lý theo luật bản quyền. Chính vì vậy, rất nhiều vụ kiện đã được đệ trình trên khắp thế giới để yêu cầu ban hành quy định chống lại hành vi bắt chước phong cách của một nghệ sĩ của AI và coi đó là vi phạm quyền sở hữu trí tuệ.

nganh-cong-nghiep-sang-tao-ai-va-van-de-ban-quyen--n1.jpg

Một số nhà nghiên cứu Úc đã bảo vệ ý kiến sử dụng tài liệu bản quyền trong việc đào tạo học thuật về máy học, lập luận rằng bản chất phi thương mại của các dự án hoàn toàn phù hợp với mục đích nghiên cứu hoặc học tập theo các điều luật hiện hành. Tuy nhiên, khi thực hiện phương pháp này, nó ngăn ngừa khả năng sử dụng kết quả của dự án bất kỳ cho mục đích thương mại sau này.

Trước nhiều khó khăn trong vấn đề bản quyền, tài liệu nguồn mở vẫn luôn được các nhà lập trình tận dụng để huấn luyện mô hình AI. Các tác phẩm nguồn mở có sẵn để sử dụng miễn phí, nhưng không hẳn là không có giới hạn, với việc sử dụng sẽ còn tuỳ theo điều khoản cấp phép nguồn mở có liên quan, chẳng hạn như một trong các giấy phép Creative Commons (Tài sản sáng tạo công cộng).

Những giấy phép này chỉ cho phép sử dụng các tài liệu trong bối cảnh phi thương mại, điều này sẽ cũng hạn chế phạm vi sử dụng trong việc đào tạo các hệ thống AI thương mại. Một số giấy phép nguồn mở cũng kết hợp các yêu cầu chú thích nguồn, do đó mọi hoạt động sử dụng các tác phẩm được cấp phép phải có ghi chú thích hợp.

Cho đến nay, dựa vào mức độ hiệu quả của các kỹ thuật máy học trong quá trình phát triển trí tuệ nhân tạo, hệ thống này chắc chắn sẽ tiếp tục mở rộng trong tương lai và đòi hỏi một khối lượng thông tin lớn hơn nữa cho quá trình đào tạo. Do đó, những cuộc tranh luận chưa có hồi kết về bản quyền giữa con người và AI chắc chắn sẽ ngày càng căng thẳng hơn trong thời gian tới.