Chào mừng bạn đến với khóa học “AI Agents for Beginners”! Khóa học này cung cấp kiến thức nền tảng và các ví dụ ứng dụng để xây dựng AI Agents.

Bài học này bao gồm:

  • AI Agents là gì và các loại agent khác nhau.
  • Các trường hợp sử dụng tốt nhất cho AI Agents và cách chúng có thể giúp chúng ta.
  • Một số khối xây dựng cơ bản khi thiết kế các giải pháp Agentic.

Định nghĩa về AI Agents và các loại AI Agents

AI Agentshệ thống cho phép Large Language Models (LLMs) thực hiện các hành động bằng cách mở rộng khả năng của chúng thông qua việc cung cấp cho LLMs quyền truy cập vào các công cụkiến thức.

Hãy chia định nghĩa này thành các phần nhỏ hơn:

  • Hệ thống – Điều quan trọng là phải nghĩ về các agent không chỉ như một thành phần đơn lẻ mà là một hệ thống gồm nhiều thành phần. Ở cấp độ cơ bản, các thành phần của một AI Agent là:
    • Môi trường – Không gian được xác định nơi AI Agent hoạt động. Ví dụ: nếu chúng ta có một AI Agent đặt vé du lịch, môi trường có thể là hệ thống đặt vé du lịch mà AI Agent sử dụng để hoàn thành các tác vụ.
    • Cảm biến – Môi trường có thông tin và cung cấp phản hồi. AI Agents sử dụng cảm biến để thu thập và diễn giải thông tin này về trạng thái hiện tại của môi trường. Trong ví dụ về Travel Booking Agent, hệ thống đặt vé du lịch có thể cung cấp thông tin như tình trạng phòng khách sạn hoặc giá vé máy bay.
    • Bộ truyền động – Sau khi AI Agent nhận được trạng thái hiện tại của môi trường, đối với tác vụ hiện tại, agent sẽ xác định hành động nào cần thực hiện để thay đổi môi trường. Đối với travel booking agent, đó có thể là đặt một phòng trống cho người dùng.
  • Large Language Models – Khái niệm về agent đã tồn tại trước khi LLMs ra đời. Ưu điểm của việc xây dựng AI Agents bằng LLMs là khả năng diễn giải ngôn ngữ và dữ liệu của con người. Khả năng này cho phép LLMs diễn giải thông tin môi trường và xác định một kế hoạch để thay đổi môi trường.
  • Thực hiện hành động – Bên ngoài các hệ thống AI Agent, LLMs bị giới hạn trong các tình huống mà hành động là tạo nội dung hoặc thông tin dựa trên lời nhắc của người dùng. Bên trong các hệ thống AI Agent, LLMs có thể hoàn thành các tác vụ bằng cách diễn giải yêu cầu của người dùng và sử dụng các công cụ có sẵn trong môi trường của chúng.
  • Truy cập vào các công cụ – Những công cụ mà LLM có quyền truy cập được xác định bởi 1) môi trường mà nó hoạt động và 2) nhà phát triển của AI Agent. Đối với ví dụ về đại lý du lịch của chúng ta, các công cụ của agent bị giới hạn bởi các hoạt động có sẵn trong hệ thống đặt phòng và/hoặc nhà phát triển có thể giới hạn quyền truy cập công cụ của agent chỉ đối với các chuyến bay.
  • Bộ nhớ + Kiến thức – Bộ nhớ có thể là ngắn hạn trong bối cảnh cuộc trò chuyện giữa người dùng và agent. Về lâu dài, ngoài thông tin do môi trường cung cấp, AI Agents cũng có thể truy xuất kiến thức từ các hệ thống, dịch vụ, công cụ khác và thậm chí cả các agent khác. Trong ví dụ về đại lý du lịch, kiến thức này có thể là thông tin về sở thích du lịch của người dùng nằm trong cơ sở dữ liệu khách hàng.

Các loại agent khác nhau

Bây giờ chúng ta đã có định nghĩa chung về AI Agents, hãy xem xét một số loại agent cụ thể và cách chúng có thể được áp dụng cho một AI agent đặt vé du lịch:

  • Simple Reflex Agents (Agent phản xạ đơn giản): Thực hiện các hành động ngay lập tức dựa trên các quy tắc được xác định trước.
    • Ví dụ: Đại lý du lịch diễn giải ngữ cảnh của email và chuyển các khiếu nại về du lịch cho bộ phận chăm sóc khách hàng.
  • Model-Based Reflex Agents (Agent phản xạ dựa trên mô hình): Thực hiện các hành động dựa trên mô hình thế giới và những thay đổi đối với mô hình đó.
    • Ví dụ: Đại lý du lịch ưu tiên các tuyến đường có thay đổi giá đáng kể dựa trên quyền truy cập vào dữ liệu giá lịch sử.
  • Goal-Based Agents (Agent dựa trên mục tiêu): Tạo kế hoạch để đạt được các mục tiêu cụ thể bằng cách diễn giải mục tiêu và xác định các hành động để đạt được mục tiêu đó.
    • Ví dụ: Đại lý du lịch đặt một hành trình bằng cách xác định các sắp xếp du lịch cần thiết (ô tô, phương tiện giao thông công cộng, chuyến bay) từ vị trí hiện tại đến điểm đến.
  • Utility-Based Agents (Agent dựa trên tiện ích): Cân nhắc các tùy chọn và cân nhắc các đánh đổi bằng số để xác định cách đạt được mục tiêu.
    • Ví dụ: Đại lý du lịch tối đa hóa tiện ích bằng cách cân nhắc sự thuận tiện so với chi phí khi đặt chuyến đi.
  • Learning Agents (Agent học tập): Cải thiện theo thời gian bằng cách phản hồi các phản hồi và điều chỉnh hành động cho phù hợp.
    • Ví dụ: Đại lý du lịch cải thiện bằng cách sử dụng phản hồi của khách hàng từ các cuộc khảo sát sau chuyến đi để điều chỉnh các đặt chỗ trong tương lai.
  • Hierarchical Agents (Agent phân cấp): Có nhiều agent trong một hệ thống phân cấp, với các agent cấp cao hơn chia các tác vụ thành các tác vụ phụ để các agent cấp thấp hơn hoàn thành.
    • Ví dụ: Đại lý du lịch hủy một chuyến đi bằng cách chia tác vụ thành các tác vụ phụ (ví dụ: hủy các đặt chỗ cụ thể) và yêu cầu các agent cấp thấp hơn hoàn thành chúng, sau đó báo cáo lại cho agent cấp cao hơn.
  • Multi-Agent Systems (MAS) (Hệ thống đa agent): Các agent hoàn thành các tác vụ độc lập, hợp tác hoặc cạnh tranh.
    • Ví dụ hợp tác: Nhiều agent đặt các dịch vụ du lịch cụ thể như khách sạn, chuyến bay và giải trí.
    • Ví dụ cạnh tranh: Nhiều agent quản lý và cạnh tranh trên lịch đặt phòng khách sạn chung để đặt phòng cho khách hàng.

Khi nào nên sử dụng AI Agents

Hãy xem xét các loại trường hợp sử dụng mà AI Agents phù hợp nhất:

  • Các vấn đề mở – cho phép LLM xác định các bước cần thiết để hoàn thành một tác vụ vì không phải lúc nào cũng có thể mã hóa cứng vào một quy trình làm việc.
  • Các quy trình đa bước – các tác vụ đòi hỏi mức độ phức tạp trong đó AI Agent cần sử dụng các công cụ hoặc thông tin qua nhiều lượt thay vì truy xuất một lần.
  • Cải thiện theo thời gian – các tác vụ mà agent có thể cải thiện theo thời gian bằng cách nhận phản hồi từ môi trường hoặc người dùng để cung cấp tiện ích tốt hơn.

Khái niệm cơ bản về giải pháp Agentic

Phát triển Agent

Bước đầu tiên trong việc thiết kế một hệ thống AI Agent là xác định các công cụ, hành động và hành vi. Trong khóa học này, chúng ta tập trung vào việc sử dụng Azure AI Agent Service để xác định các Agent của mình. Nó cung cấp các tính năng như:

  • Lựa chọn các Open Model như OpenAI, Mistral và Llama
  • Sử dụng Dữ liệu được cấp phép thông qua các nhà cung cấp như Tripadvisor
  • Sử dụng các công cụ OpenAPI 3.0 tiêu chuẩn hóa

Các mẫu Agentic

Giao tiếp với LLMs thông qua lời nhắc (prompts). Với tính chất bán tự động của AI Agents, không phải lúc nào cũng có thể hoặc cần thiết phải nhắc lại LLM một cách thủ công sau khi môi trường thay đổi. Chúng ta sử dụng Các mẫu Agentic cho phép chúng ta nhắc LLM qua nhiều bước một cách có khả năng mở rộng hơn.

Khóa học này được chia thành một số mẫu Agentic phổ biến hiện nay.

Các Framework Agentic

Các Framework Agentic cho phép các nhà phát triển triển khai các mẫu agentic thông qua mã. Các framework này cung cấp các mẫu, plugin và công cụ để cộng tác AI Agent tốt hơn. Những lợi ích này cung cấp khả năng quan sát và khắc phục sự cố hệ thống AI Agent tốt hơn.

Trong khóa học này, chúng ta sẽ khám phá framework AutoGen dựa trên nghiên cứu và framework Agent sẵn sàng cho sản xuất từ Semantic Kernel.

Nguồn : https://microsoft.github.io/ai-agents-for-beginners/

Comments

Leave a Reply

Sign In

Register

Reset Password

Please enter your username or email address, you will receive a link to create a new password via email.