Machine Learning Frameworks

Chỉ 2 phút: Google Gemini AI Agent

Gemini, công cụ AI mới nhất của Google, đã thể hiện khả năng nghiên cứu AI tác nhân (Agentic AI) tiên tiến nhất. Một nhóm các tác nhân AI làm việc cùng nhau để hoàn thành quy trình nghiên cứu chỉ trong vòng 2 phút, bao gồm các bước:

Lập kế hoạch
Tìm kiếm trên web
Phân tích kết quả
Tạo báo cáo nghiên cứu chi tiết

https://video.twimg.com/amplify_video/1879732058710532096/vid/avc1/1280x720/uR0Md4n7odehHEKr.mp4?tag=14

Khám phá ứng dụng LLM với AI Agents và RAG

Nếu bạn quan tâm đến các ứng dụng LLM (Large Language Model) sử dụng AI Agents và RAG (Retrieval-Augmented Generation), hãy khám phá kho lưu trữ GitHub sau đây. Người dùng khuyến khích độc giả thể hiện sự ủng hộ bằng cách gắn sao cho kho lưu trữ này:

github.com/Shubhamsaboo/a…

Hướng dẫn chi tiết về ứng dụng LLM

Để học hỏi thêm về cách xây dựng ứng dụng LLM với AI Agents và RAG, người dùng giới thiệu một nguồn tài liệu hữu ích khác. Trang web theunwindai.com cung cấp hơn 50 hướng dẫn từng bước về cách tạo các ứng dụng LLM. Họ khuyến khích độc giả đăng ký miễn phí để truy cập các hướng dẫn trong tương lai.

Nvidia: Đột phá Công nghệ AI và Tham vọng Trở thành Công ty Giá trị Nhất Thế giới

Nvidia đang trên đà trở thành công ty có giá trị nhất thế giới. Hôm qua, họ đã thay đổi thế giới. CEO Jensen Huang đã công bố những đột phá trong:

Siêu chip AI
Card đồ họa cho game
Lái xe tự động và robot

Dưới đây là 7 thông báo hàng đầu:

Hôm qua, họ đã giới thiệu những đột phá trong card đồ họa cho game. Sản phẩm hàng đầu của họ, RTX 5090, có hiệu suất gấp đôi so với sản phẩm hàng đầu của thế hệ trước, RTX 4090. Card đồ họa mới cấp thấp – RTX 5070, có thể đạt hiệu suất ngang bằng với RTX 4090 với giá chỉ 549 USD.

https://video.twimg.com/ext_tw_video/1876632419165523968/pu/vid/avc1/1280x720/7Fjsyuq7C3_1gp-b.mp4?tag=12

Nvidia đã giới thiệu máy tính để bàn đầu tiên của họ có tên Project DIGITS. Với mức giá 3.000 USD, chiếc máy tính mạnh mẽ này được trang bị siêu chip GB10 mới của NVDA, GPU Blackwell và CPU Grace. Với kích thước chỉ bằng bàn tay, các nhà phát triển có thể làm việc với các mô hình AI có tới 405 tỷ tham số.

Siêu chip AI mới của họ, GB10, là phiên bản nhỏ gọn của GB200 công suất cao. Được thiết kế cho các nhà phát triển AI, nhà nghiên cứu và sinh viên để chạy các mô hình AI phức tạp. GB10 sẽ cung cấp năng lượng cho máy tính để bàn mới của họ, Project DIGITS.

Nền tảng NVIDIA DRIVE Hyperion AV mới cung cấp tính năng an toàn và khả năng nâng cao cho lái xe tự động. Nó tích hợp các cảm biến, hệ điều hành, hệ thống lái cấp 2 và các hệ thống an toàn cho các phương tiện thế hệ tiếp theo. Nó đã được Mercedes-Benz, JLR và Volvo áp dụng.

“Khoảnh khắc ChatGPT cho robot tổng quát đang ở ngay trước mắt,” Jensen nói khi công bố nền tảng mô hình nền tảng thế giới Cosmos. Để đẩy nhanh AI trong xe tự lái và robot, Cosmos cung cấp các công cụ và mô hình mô phỏng vật lý và kịch bản thế giới thực.

https://video.twimg.com/ext_tw_video/1876633598775734272/pu/vid/avc1/1280x720/EHeTx1ggIOHkaaly.mp4?tag=12

Các bản thiết kế AI mới cho AI tác nhân, cho phép các nhà phát triển tự động hóa công việc cho doanh nghiệp. Dưới đây là một số quy trình làm việc có thể:

Bản thiết kế tác nhân giọng nói Daily đạt được AI hội thoại thời gian thực
Bản thiết kế AI chuyển đổi PDF thành podcast biến nhiều tài liệu PDF dài, phức tạp thành bài đọc được tạo bởi AI
Bản thiết kế trợ lý nghiên cứu tài liệu của LlamaIndex để tạo blog giúp viết các bài blog chất lượng cao.

NVIDIA công bố Bản thiết kế Isaac GR00T cho Học bắt chước Robot Hình người. Học bắt chước giúp robot hình người học kỹ năng bằng cách bắt chước con người. Nhưng việc xây dựng bộ dữ liệu chất lượng cao rất tốn thời gian và chi phí. Isaac GR00T cho phép các nhà phát triển tạo ra các bộ dữ liệu tổng hợp lớn từ một vài bản demo của con người.

Cổ phiếu của Nvidia đóng cửa ở mức cao kỷ lục 149,43 USD vào thứ Hai, đưa giá trị của công ty lên 3,66 nghìn tỷ USD. Hiện tại, họ đang cạnh tranh sát sao với Apple để trở thành công ty có giá trị nhất thế giới.

CEO Nvidia Jensen Huang nói: “Tôi nghĩ trong vài năm tới, nhân loại sẽ tạo ra nhiều dữ liệu hơn tất cả những gì nhân loại đã từng tạo ra kể từ khi bắt đầu.” Bạn nghĩ tương lai sẽ như thế nào cho AI và Nvidia?

Google thách thức OpenAI với loạt sản phẩm AI đột phá mới

OpenAI nên lo lắng. Google đã và đang phát triển và tung ra thị trường những sản phẩm AI đột phá, từ Gemini 2.0 đến Veo 2. Cuộc chơi AI đã hoàn toàn thay đổi. Không còn rào cản nào nữa. Dưới đây là tổng quan về những sản phẩm mới nhất của Google:

https://video.twimg.com/ext_tw_video/1869753611149787136/pu/vid/avc1/1200x720/scPA7LJJ2qJD0l29.mp4?tag=12

Gemini 2.0 Multimodal Real-Time: Mô hình đa phương thức thời gian thực này đã gây ấn tượng mạnh với khả năng tạo hình ảnh, tạo âm thanh và làm việc với các công cụ như Tìm kiếm và nền tảng lập trình.
Project Jules: Trợ lý lập trình AI này giúp xử lý các công việc lập trình như sửa lỗi, cho phép các nhà phát triển tập trung vào các nhiệm vụ sáng tạo. Hiện đang trong giai đoạn thử nghiệm.
Whisk: Công cụ AI này kết hợp hình ảnh và gợi ý văn bản để tạo ra những hình ảnh sáng tạo hoàn toàn mới. Hiện có sẵn tại Hoa Kỳ, Whisk giúp biến trí tưởng tượng của bạn thành hiện thực.
Willow: Chip lượng tử mới của Google được dự đoán sẽ thay đổi hoàn toàn ngành điện toán. Các nhà vật lý của Google thậm chí còn tuyên bố “Willow” có thể chứng minh sự tồn tại của các vũ trụ song song.
Veo 2: Công cụ này tạo ra các video chất lượng cao từ văn bản. Veo 2 hiểu chuyển động tốt hơn bao giờ hết và đang được thử nghiệm trong các công cụ như VideoFX và Whisk.
Gemini Advanced Deep Research: AI của Google giờ đây có thể thực hiện nghiên cứu chuyên sâu, kiểm tra hàng chục hoặc nhiều hơn các trang web và bài báo trong vài phút, kèm theo trích dẫn.
Project Mariner: Đây là một tiện ích mở rộng Chrome được hỗ trợ bởi AI, có khả năng đọc và tương tác với nội dung web, như điền biểu mẫu hoặc phân tích hình ảnh với sự tham gia của con người. Hiện đang trong giai đoạn thử nghiệm ban đầu.

I'm deeply impressed.

You can now have your own AI tutor who can see your screen and chat in real time with Gemini 2.0.

It's a real revolution in the way you learn new things.

Available for free using Google AI Studio (link below) pic.twitter.com/cq8THJndTy
— Paul Couvert (@itsPaulAi) December 11, 2024

https://video.twimg.com/amplify_video/1869057059137650691/vid/avc1/1280x720/W8UyksqMOryCRTK1.mp4?tag=14

https://twitter.com/dr_cintas/status/1869089768723886376

https://twitter.com/PopBase/status/1869410458320650386

https://twitter.com/RubenHssd/status/1869023374074167716

https://video.twimg.com/ext_tw_video/1867651997131853824/pu/vid/avc1/1096x720/gpQgss9omuiL9vpO.mp4?tag=12

https://video.twimg.com/ext_tw_video/1869750668786896896/pu/vid/avc1/1280x720/5OMBsuwts4I23B99.mp4?tag=12

AI vượt trội bác sĩ trong chẩn đoán: Bước tiến đáng kinh ngạc của OpenAI

link

Theo báo cáo mới nhất của OpenAI, mô hình o1-preview vượt trội hơn hẳn các bác sĩ trong các nhiệm vụ suy luận, và khoảng cách này là rất lớn. AI đạt khoảng 80% so với 30% của bác sĩ trong 143 ca chẩn đoán CPC khó từ NEJM. Hiện nay, việc chỉ tin tưởng vào bác sĩ mà không tham khảo ý kiến của mô hình AI có thể là nguy hiểm. Dưới đây là một số ví dụ cụ thể:

Ví dụ về chẩn đoán phức tạp

Trường hợp mất phosphate và tăng FGF23

Trong một trường hợp liên quan đến mất phosphate và tăng FGF23, sau đó tiến hành chụp ảnh để xác định vị trí khối u tiềm ẩn, o1-preview đề xuất kế hoạch xét nghiệm toàn diện và có hệ thống hơn:

Mô hình AI đề xuất một cách tiếp cận rộng hơn và có phương pháp hơn, loại trừ một cách có hệ thống các nguyên nhân khác gây ra tình trạng giảm phosphate máu (hypophosphatemia).

Trường hợp tăng amoniac máu dai dẳng không rõ nguyên nhân

Đối với trường hợp tăng amoniac máu (hyperammonemia) dai dẳng không rõ nguyên nhân, o1-preview đề xuất mở rộng các xét nghiệm theo thứ tự ưu tiên:

Từ các xét nghiệm cơ bản như immunoglobulin và điện giải đến chụp ảnh nâng cao, xét nghiệm hơi thở để kiểm tra SIBO (Small Intestinal Bacterial Overgrowth – Hội chứng tăng sinh vi khuẩn đường ruột) và sinh thiết đường tiêu hóa chuyên biệt – đảm bảo kiểm tra các nguyên nhân phổ biến trước.

Ý nghĩa của sự phát triển này

Người viết bày tỏ sự tôn trọng đối với các bác sĩ, nhưng trong nhiều trường hợp, công việc của họ là suy luận cơ bản trên một cơ sở kiến thức chuyên ngành rộng lớn. May mắn thay, đây chính xác là điều mà các mô hình ngôn ngữ lớn (LLM) rất giỏi. Điều này có nghĩa là sẽ có nhiều dịch vụ chăm sóc sức khỏe chất lượng cao hơn cho mọi người.

Link