Tìm hiểu tất cả về các Plugin ChatGPT mới từ OpenAI cũng như các bên thứ ba và cách chúng hoạt động để nâng cao khả năng của chatbot.
ChatGPT đã càn quét cả Giới công nghệ kể từ khi nó được phát hành ra công chúng. Bên cạnh những ưu điểm của nó, nó có một khuyết điểm nhỏ không nhỏ lắm; nó không có quyền truy cập vào thông tin gần đây. Thông tin duy nhất nó có là đến giữa năm 2021. Nhưng OpenAI cuối cùng cũng bắt đầu thay đổi điều đó. OpenAI cuối cùng cũng triển khai hỗ trợ sớm cho các plugin trong ChatGPT cho phép nó kết nối với internet cũng như một số dịch vụ của bên thứ ba!
Plugin ChatGPT là gì?
Plugin là những công cụ được thiết kế riêng cho các Language Model. Chún nâng cao khả năng của chatbot và để nó đảm nhận những nhiệm vụ trước đây không thể thực hiện được. Ví dụ: giờ đây nó có thể truy xuất thông tin theo thời gian thực, như tỷ số thể thao, giá cổ phiếu, thực hiện các hành động thay mặt người dùng, như đặt chuyến bay và truy xuất thông tin cơ sở tri thức, như tài liệu công ty, v.v.
Kể từ khi ChatGPT ra mắt, plugin là thứ được người dùng yêu cầu nhiều nhất và OpenAI cuối cùng đã được cung cấp. Nhưng bản phát hành của họ sẽ là một bản giới thiệu lặp đi lặp lại dần dần. Ban đầu, OpenAI chỉ phát hành một số plugin của bên thứ ba và một vài plugin của riêng họ.
Quyền truy cập cho người dùng cũng như các nhà phát triển muốn xây dựng plugin hiện cũng bị hạn chế. Ngoài ra, với tư cách là người dùng cuối, quyền truy cập chỉ được cấp cho người dùng ChatGPT Plus vào lúc này, nhưng ChatGPT cho biết họ có kế hoạch mở rộng việc triển khai trong tương lai.
Chỉ có thể yêu cầu quyền truy cập sau khi tham gia danh sách chờ của họ , điều này đòi hỏi phải điền vào một bảng câu hỏi nhỏ về lý do bạn muốn truy cập và liệu bạn có sẵn sàng cung cấp phản hồi hay không.
Danh sách các plugin của bên thứ ba bao gồm:
- Expedia – Plugin này sẽ cho phép bạn lên kế hoạch cho chuyến đi tiếp theo với ChatGPT, với thông tin đầy đủ về tình trạng phòng trống và giá cả của khách sạn, chuyến bay, v.v.
- FiscalNote – Plugin ChatGPT này sẽ cho phép bạn truy cập vào thông tin và dữ liệu pháp lý, chính trị và quy định theo thời gian thực.
- Instacart – Sử dụng ChatGPT để đặt hàng tạp hóa từ các cửa hàng tạp hóa và siêu thị gần đó.
- KAYAK – Sử dụng KAYAK (Công ty lữ hành đa quốc gia) trong ChatGPT để tìm ô tô, khách sạn, dịch vụ cho thuê, v.v. trong phạm vi ngân sách đã xác định của bạn.
- Klarna Shopping – Tìm kiếm và so sánh giá từ các cửa hàng online khác nhau trong cuộc chat ChatGPT của bạn.
- Milo Family AI – Plugin dành cho cha mẹ để nâng cao năng lực nuôi dạy con cái.
- OpenTable – Nhận đề xuất nhà hàng và liên kết đặt chỗ.
- Mua sắm từ Shopify – Tìm kiếm sản phẩm từ các thương hiệu khác nhau.
- Slack – Sử dụng ChatGPT với Slack để hợp lý hóa giao tiếp
- Speak – Nhận một gia sư ngôn ngữ được hỗ trợ bởi AI
- Wolfram – Tải ChatGPT để truy cập các tính toán, kiến thức toán học, v.v.
- Zapier – Sử dụng plugin này để tương tác với hơn 5000 ứng dụng trong ChatGPT.
Ngoài ra còn có hai plugin từ chính OpenAI: Duyệt (trình duyệt web) và Trình thông dịch mã và một plugin nguồn mở, được gọi là Retriever. Tất cả các plugin hiện đang trong giai đoạn thử nghiệm Alpha.
Các plugin này hoạt động như thế nào?
Theo OpenAI, plugin là “tai mắt” cho các mô hình ngôn ngữ như ChatGPT. Thực tế về các mô hình ngôn ngữ là chúng chỉ có thể học từ dữ liệu huấn luyện của chúng và việc học có thể bị hạn chế. ChatGPT chỉ có thể tự cung cấp các hướng dẫn dựa trên văn bản. Các plugin này có thể làm cho nó tuân theo các hướng dẫn này cũng như cung cấp thông tin có sẵn quá gần đây, quá cá nhân hoặc quá cụ thể và không thể đưa vào dữ liệu đào tạo.
Nhưng có một mối lo ngại về an toàn nảy sinh khi bạn nghĩ về một mô hình AI làm theo hướng dẫn và thay mặt bạn thực hiện các hành động. Đó là lý do tại sao các plugin đang được triển khai chậm. OpenAI đang xây dựng chúng với nguyên tắc cốt lõi là an toàn và sẽ giám sát việc sử dụng chúng trong thế giới thực.
Chúng ta hãy xem một số mô hình plugin này hoạt động như thế nào.
Browsing
Đây là plugin kết nối ChatGPT với internet và là 1 trong 2 plugin của chính OpenAI. Plugin sử dụng API tìm kiếm Bing từ Microsoft trong một loạt các sự kiện không gây tò mò; hai công ty đã có thỏa thuận từ nhiều năm trước. Ngoài các khoản đầu tư ban đầu, Microsoft hiện cũng sử dụng công nghệ OpenAI để cung cấp năng lượng cho Bing AI mới của họ.
Mô hình không chỉ biết cách duyệt internet mà còn biết khi nào duyệt internet và khi nào không. Ví dụ: khi người dùng hỏi ChatGPT về thông tin về giải Oscar 2023, ChatGPT sẽ tìm kiếm chính xác truy vấn trên internet. Nhưng khi được hỏi về lễ trao giải Oscar đầu tiên từng được tổ chức, nó không tìm kiếm trên internet vì thông tin đó là một phần dữ liệu đào tạo của nó.
Lưu ý: Dựa trên những lần xuất hiện ban đầu, có vẻ như ‘Browsing’ và ‘Trình thông dịch mã’ là các mô hình riêng biệt với ‘Plugin’. Cách nó hoạt động là bạn sẽ chọn mô hình bạn hiện muốn sử dụng từ menu thả xuống, bao gồm ba tùy chọn: Duyệt, Trình thông dịch mã và Plugin.
Vì vậy, để ChatGPT duyệt internet, bạn sẽ phải chọn mô hình/plugin ‘Browsing’.
Giờ đây, khi người dùng nhập lời nhắc yêu cầu duyệt internet, nó sẽ làm như vậy; quá trình này sẽ mất một khoảng thời gian vì bot sẽ cần thời gian để làm quen với thông tin. Bạn có thể xem luồng hành động của ChatGPT cho đến khi nó tạo phản hồi bằng cách mở rộng ô ‘Browsing the web..’.
Ở đó, bạn có thể xem nó đã tìm kiếm những truy vấn nào, nó đã nhấp vào liên kết nào và thời điểm nó đọc trong thời gian thực. Nó sử dụng một trình duyệt web dựa trên văn bản để có thể vượt ra ngoài các kết quả tìm kiếm và thực sự đọc và điều hướng các trang web.
Sau khi ChatGPT bắt kịp các sự kiện, nó sẽ cung cấp cho bạn câu trả lời theo mô hình ngôn ngữ tự nhiên như trước đây. Nhưng câu trả lời sẽ bao gồm các trích dẫn khi nó được tạo bằng mô hình Duyệt web. Nhấp vào trích dẫn sẽ đưa bạn đến trang web. Khía cạnh cụ thể này giống với Bing Chat AI.
Từ quan điểm an toàn, trình duyệt dựa trên văn bản chỉ có thể thực hiện các yêu cầu GET, điều này làm giảm một số rủi ro nhất định. Ví dụ: mô hình chỉ có thể truy xuất thông tin từ internet chứ không thể thực hiện các thao tác “giao dịch”, như gửi biểu mẫu.
Code Interpreter
Mô hình Trình thông dịch mã, plugin thứ hai của OpenAI, cung cấp cho ChatGPT một trình thông dịch Python. Nó cũng cung cấp cho nó một số dung lượng đĩa tồn tại trong thời gian ngắn.
Phiên vẫn hoạt động trong một cuộc chat duy nhất, vì vậy cuộc gọi tiếp theo có thể được xây dựng dựa trên cuộc gọi trước nhưng có giới hạn thời gian giới hạn trên. Ngoài ra, Trình thông dịch mã cũng hỗ trợ tải file lên và tải xuống file có kết quả.
Để giữ an toàn, OpenAI đang giữ nó trong một môi trường thực thi có tường lửa, hộp cát. Truy cập Internet cũng bị vô hiệu hóa đối với Trình thông dịch mã. Theo OpenAI, mặc dù động thái này hạn chế chức năng của mô hình, nhưng ban đầu họ cảm thấy đó là một động thái đúng đắn.
Mô hình ‘Code Interpreter’ phải được chọn trước khi bắt đầu cuộc hội thoại.
Sau khi người dùng nhập lời nhắc yêu cầu sử dụng plugin Trình thông dịch mã, ChatGPT sẽ bắt đầu sử dụng nó để thực hiện các phép tính cần thiết. Cũng giống như Duyệt web, người dùng có thể xem quy trình tính toán của ChatGPT bằng cách nhấp vào ‘Hiển thị công việc’ và tất cả các bước trong phép tính sẽ hiển thị.
Trong các thử nghiệm ban đầu, OpenAI đã phát hiện ra plugin này hữu ích trong một số tình huống nhất định. Bao gồm các:
- Giải quyết các vấn đề toán học, cả định lượng và định tính, mà khá thẳng thắn, người dùng nhận thấy ChatGPT trước đây là rác rưởi.
- Thực hiện phân tích và trực quan hóa dữ liệu, được rất nhiều người dùng hào hứng.
- Chuyển đổi tập tin giữa các format
OpenAI mong muốn người dùng khám phá các tác vụ hữu ích hơn mà Trình thông dịch mã có thể thực hiện khi họ dùng thử.
Plugin của bên thứ ba
Phần còn lại của plugin thuộc mô hình Plugins. Điều này cũng bao gồm plugin Retriever mã nguồn mở từ OpenAI mà các nhà phát triển sẽ có thể sử dụng và 12 plugin của bên thứ ba.
Khi mô hình Plugins được chọn từ trình đơn thả xuống, người dùng có thể cài đặt các plugin mong muốn từ cửa hàng.
Dưới đây là cách các plugin sẽ hoạt động một cách ngắn gọn:
Sau khi người dùng kích hoạt một plugin bằng cách cài đặt nó (chúng sẽ không được kích hoạt tự động) và bắt đầu cuộc chat, OpenAI sẽ đưa một mô tả ngắn gọn về plugin vào ChatGPT trong một tin nhắn. Thông báo này không hiển thị với người dùng cuối nhưng nó sẽ bao gồm mô tả, điểm cuối và ví dụ về plugin. Vì vậy, cho đến khi bạn chọn sử dụng plugin trong cuộc chat, ChatGPT sẽ không biết gì về nó. Bạn phải kích hoạt các plugin bạn muốn sử dụng trong mọi cuộc chat.
Bây giờ, bạn có thể đặt truy vấn của mình vào ChatGPT. Nếu bot thấy việc gọi plugin là phù hợp, bot sẽ thực hiện việc đó bằng cách sử dụng lệnh gọi API. Nói cách khác, nó có thể tự quyết định xem có cần gọi plugin hay không.
Sau đó, nó sẽ bao gồm các kết quả mà nó nhận được từ plugin trong phản hồi mà nó tạo ra cho bạn.
Dưới đây là ví dụ về cách ChatGPT sử dụng plugin từ OpenTable, Wolfram và Instacart. Một người dùng yêu cầu ChatGPT giới thiệu một nhà hàng thuần chay cho Thứ Bảy và một công thức thuần chay cho Chủ Nhật. Họ cũng yêu cầu nó tính toán lượng calo cho công thức mà nó đề xuất sử dụng Wolfram cũng như đặt mua nguyên liệu cho công thức từ Instacart. AI bot thực hiện chính xác điều đó.
Đầu tiên, nó sử dụng OpenTable để giới thiệu một nhà hàng và liên kết để đặt chỗ.
Nó đề xuất một công thức thuần chay (điều mà trước đây nó có thể làm được) và sau đó tính toán lượng calo cho công thức đó bằng cách sử dụng Wolfram.
Cuối cùng, nó thêm tất cả các thành phần cần thiết vào giỏ hàng trên Instacart và hiển thị cho người dùng liên kết mà người dùng chỉ cần nhấp vào để hoàn tất đơn hàng!