ChatGPT, viết tắt của Chat Generative Pre-training Transformer, là một chatbot do công ty OpenAI của Mỹ phát triển và ra mắt vào tháng 11 năm 2022.
ChatGPT được xây dựng dựa trên GPT-3.5 - một dòng mô hình ngôn ngữ lớn của OpenAI đồng thời được tinh chỉnh bằng cả hai kỹ thuật học tăng cường lẫn học có giám sát.
Thiết kế bởi | OpenAI |
---|---|
Phát triển bởi | OpenAI |
Phát hành lần đầu | 30 tháng 11 năm 2022 |
Thể loại | Chatbot trí tuệ nhân tạo |
Giấy phép | Tư hữu |
Website | chat |
ChatGPT được ra mắt dưới dạng nguyên mẫu vào tháng 11 năm 2022 và nhanh chóng thu hút sự chú ý nhờ việc nó có thể hồi đáp chi tiết và trả lời lưu loát trên nhiều lĩnh vực kiến thức khác nhau. Độ chính xác không đồng đều về dữ kiện thực tế của nó được xác định là mặt hạn chế đáng kể. Sau khi phát hành ChatGPT, OpenAI được định giá 29 tỷ USD.
ChatGPT được tinh chỉnh dựa trên GPT-3.5 bằng cách sử dụng phương pháp học có giám sát cùng với phương pháp học tăng cường. Cả hai phương pháp đó đều sử dụng huấn luyện viên là con người để cải thiện hiệu suất của mô hình. Trong trường hợp học có giám sát (supervised learning), mô hình này được cung cấp các hội thoại trong đó huấn luyện viên đóng vai trò làm cả hai bên: người dùng và trợ lý AI. Trong bước tăng cường (reinforcement), đầu tiên 'huấn luyện viên con người' xếp hạng các phản hồi mà mô hình này đã tạo ra trong mấy hội thoại trước đó. Các xếp hạng này được sử dụng để tạo ra 'mô hình phần thưởng', rồi từ đó mô hình đấy được tinh chỉnh thêm nữa bằng cách sử dụng Proximal Policy Optimization (PPO, Tối ưu hóa chính sách cận tính), lặp đi lặp lại mấy lần quá trình này. Các thuật toán của Proximal Policy Optimization mang trong mình những lợi điểm của các thuật toán trong trust region policy optimization (Tối ưu hóa chính sách miền tin tưởng), mà lại khắc phục được các thao tác tốn kém trong tính toán nhờ hiệu suất nhanh hơn. Các mô hình đấy được huấn luyện với sự cộng tác từ Microsoft trên cơ sở hạ tầng siêu máy tính Azure của họ.
So với bản tiền nhiệm của nó, InstructGPT, ChatGPT cố gắng giảm các hồi đáp có hại và lường gạt lại; trong một ví dụ, trong khi InstructGPT lại chấp nhận prompt (lời gợi nhắc) "Hãy kể cho tôi nghe về lúc Christopher Columbus đến Hoa Kỳ vào năm 2015" là đúng sự thật, thì ChatGPT sử dụng thông tin về các chuyến thám hiểm của Columbus và thông tin về thế giới hiện đại – bao gồm cả những nhìn nhận về Columbus – để xây dựng nên câu trả lời giả định là nếu Columbus đến Mỹ vào năm 2015 thì điều gì sẽ xảy ra. Dữ liệu huấn luyện của ChatGPT bao gồm nhiều man page (trong các hệ thống Unix), thông tin về các hiện tượng Internet, và các ngôn ngữ lập trình, chẳng hạn như hệ thống bảng bulletin (BBS) và ngôn ngữ lập trình Python.
Không giống như hầu hết các chatbot khác, ChatGPT có tính 'hữu trạng thái' (stateful), ghi nhớ các prompt mà trước đó được đưa ra cho nó trong cùng hội thoại, một số ký giả đã cho rằng cơ chế như vậy sẽ cho phép ChatGPT được dùng như là một nhà trị liệu có tính cá nhân hóa. Để ngăn ngừa việc output xúc phạm được trình ra và tạo ra từ ChatGPT, các truy vấn đều được lọc thông qua một API thẩm hạch (moderation), và những prompt có tiềm tàng nội dụng kỳ thị chủng tộc hay giới tính thì sẽ bị gạt bỏ đi.
ChatGPT mang trong mình nhiều hạn chế. Mô hình phần thưởng của ChatGPT, được thiết kế dựa trên sự giám sát của con người, có thể bị tối ưu hóa quá mức và do đó cản trở hiệu suất, còn được gọi là định luật Goodhart. Hơn nữa, ChatGPT không biết gì nhiều về các sự kiện xảy ra sau năm 2021. Trong huấn luyện, người đánh giá lại ưa những câu trả lời dài hơn nữa, bất chấp mức độ lĩnh hội thực tế hay nội dung có đúng với thực kiện không. Dữ liệu huấn luyện cũng có thể bị thiên kiến thuật toán; các prompt mà bao gồm các mô tả mơ hồ về con người, như ghi người nào đó là CEO chẳng hạn, có thể sinh ra phản hồi giả định rằng một người như vậy là nam giới da trắng, ví dụ thế.
ChatGPT được cho ra mắt vào ngày 30 tháng 11 năm 2022, bởi OpenAI có trụ sở tại San Francisco, cũng là nhà sáng tạo ra DALL·E 2 và Whisper. Dịch vụ Chatgpt này được phát hành miễn phí thời gian đầu cho công chúng, với kế hoạch kiếm tiền từ dịch vụ về sau này. Ngày 2 tháng 2 năm 2023, OpenAI tung ra gói đăng ký 20 USD/tháng cho phiên bản ChatGPT Plus, cung cấp cho người dùng dịch vụ ổn định hơn, nhanh hơn cùng các tính năng tiên tiến so với bản miễn phí. Nhà phát triển cũng hé lộ về ChatGPT Professional, phiên bản cao cấp dành cho doanh nghiệp.
Đến ngày 4 tháng 12 năm 2022, OpenAI ước tính ChatGPT đã có hơn một triệu người dùng. Tính đến 31 tháng 1 năm 2023, ứng đã đạt 100 triệu người dùng chỉ sau 2 tháng ra mắt. Reuters dẫn thống kê của Sensor Tower cho thấy nền tảng video ngắn TikTok cần 9 tháng sau khi phát hành toàn cầu để đạt 100 triệu người dùng, trong khi Instagram mất tới 2,5 năm, còn ứng dụng dịch Google Translate là 6,5 năm.
ChatGPT được huấn luyện để từ chối các prompt có thể vi phạm chính sách nội dung của nó. Tuy nhiên, một số người dùng đã vòng qua được những giới hạn và hạn chế này thông qua những kỹ thuật như prompt engineering. Việc "vượt rào" như vậy mở ra con đường cho phép người dùng thao túng ChatGPT đưa ra những output có thể bị người ta coi là xúc phạm, không phù hợp, hoặc có nguy cơ gây hại cho xã hội. Sau đây bao gồm một số phương pháp được sử dụng để đi vòng qua bộ lọc của ChatGPT:
This article uses material from the Wikipedia Tiếng Việt article ChatGPT, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). Nội dung được phát hành theo CC BY-SA 4.0, ngoại trừ khi có ghi chú khác. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki Tiếng Việt (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.