news | Én Bay

Google thách thức OpenAI với loạt sản phẩm AI đột phá mới

OpenAI nên lo lắng. Google đã và đang phát triển và tung ra thị trường những sản phẩm AI đột phá, từ Gemini 2.0 đến Veo 2. Cuộc chơi AI đã hoàn toàn thay đổi. Không còn rào cản nào nữa. Dưới đây là tổng quan về những sản phẩm mới nhất của Google:

https://video.twimg.com/ext_tw_video/1869753611149787136/pu/vid/avc1/1200x720/scPA7LJJ2qJD0l29.mp4?tag=12

Gemini 2.0 Multimodal Real-Time: Mô hình đa phương thức thời gian thực này đã gây ấn tượng mạnh với khả năng tạo hình ảnh, tạo âm thanh và làm việc với các công cụ như Tìm kiếm và nền tảng lập trình.
Project Jules: Trợ lý lập trình AI này giúp xử lý các công việc lập trình như sửa lỗi, cho phép các nhà phát triển tập trung vào các nhiệm vụ sáng tạo. Hiện đang trong giai đoạn thử nghiệm.
Whisk: Công cụ AI này kết hợp hình ảnh và gợi ý văn bản để tạo ra những hình ảnh sáng tạo hoàn toàn mới. Hiện có sẵn tại Hoa Kỳ, Whisk giúp biến trí tưởng tượng của bạn thành hiện thực.
Willow: Chip lượng tử mới của Google được dự đoán sẽ thay đổi hoàn toàn ngành điện toán. Các nhà vật lý của Google thậm chí còn tuyên bố “Willow” có thể chứng minh sự tồn tại của các vũ trụ song song.
Veo 2: Công cụ này tạo ra các video chất lượng cao từ văn bản. Veo 2 hiểu chuyển động tốt hơn bao giờ hết và đang được thử nghiệm trong các công cụ như VideoFX và Whisk.
Gemini Advanced Deep Research: AI của Google giờ đây có thể thực hiện nghiên cứu chuyên sâu, kiểm tra hàng chục hoặc nhiều hơn các trang web và bài báo trong vài phút, kèm theo trích dẫn.
Project Mariner: Đây là một tiện ích mở rộng Chrome được hỗ trợ bởi AI, có khả năng đọc và tương tác với nội dung web, như điền biểu mẫu hoặc phân tích hình ảnh với sự tham gia của con người. Hiện đang trong giai đoạn thử nghiệm ban đầu.

I'm deeply impressed.

You can now have your own AI tutor who can see your screen and chat in real time with Gemini 2.0.

It's a real revolution in the way you learn new things.

Available for free using Google AI Studio (link below) pic.twitter.com/cq8THJndTy
— Paul Couvert (@itsPaulAi) December 11, 2024

https://video.twimg.com/amplify_video/1869057059137650691/vid/avc1/1280x720/W8UyksqMOryCRTK1.mp4?tag=14

https://twitter.com/dr_cintas/status/1869089768723886376

https://twitter.com/PopBase/status/1869410458320650386

https://twitter.com/RubenHssd/status/1869023374074167716

https://video.twimg.com/ext_tw_video/1867651997131853824/pu/vid/avc1/1096x720/gpQgss9omuiL9vpO.mp4?tag=12

https://video.twimg.com/ext_tw_video/1869750668786896896/pu/vid/avc1/1280x720/5OMBsuwts4I23B99.mp4?tag=12

Tin tức AI: OpenAI ra mắt ‘ChatGPT Canvas’ và các công cụ AI mới

OpenAI vừa triển khai ‘ChatGPT Canvas’ cho tất cả người dùng. Ngoài ra còn có các agent AI mới cho lập trình, Sora, Google Willow, trình tạo hình ảnh Grok của xAI, phòng thí nghiệm AGI của Amazon, cuộc gọi điện thoại bằng agent Lindy và Meta COCONUT. Dưới đây là những điều bạn cần biết:

OpenAI vừa cung cấp Canvas, giao diện viết và lập trình màn hình chia đôi cho phép cộng tác, cho tất cả người dùng. Tính năng này hiện có:

Tích hợp sẵn với gpt-4o
Tích hợp Python để thực thi mã trực tiếp
Tích hợp trong các GPT tùy chỉnh

Cognition Labs chính thức ra mắt Devin, trợ lý AI dành cho nhà phát triển. Nền tảng này nhắm đến các nhóm kỹ thuật và cung cấp các khả năng từ sửa lỗi đến tạo PR tự động. Giá khởi điểm khá cao, 500 USD/tháng cho quyền truy cập không giới hạn cho cả nhóm.

Về mặt trợ lý lập trình AI khác, Replit vừa chính thức ra mắt bộ công cụ phát triển AI nâng cấp của mình. Startup này đang đưa ‘Agent’ ra khỏi giai đoạn truy cập sớm và giới thiệu công cụ Assistant mới, tập trung vào cải tiến và sửa lỗi nhanh cho các dự án.

OpenAI chính thức ra mắt Sora, mô hình tạo video AI được mong đợi từ lâu của công ty. Nó có sẵn cho người đăng ký ChatGPT Plus và Pro thông qua sora.com với một số tính năng chỉnh sửa và sáng tạo mới. Đây là bản tạo đầu tiên của tôi:

Google tiết lộ Willow, một chip máy tính lượng tử với những bước đột phá lớn về hiệu suất trong việc sửa lỗi và tốc độ tính toán. Willow hoàn thành một phép tính trong 5 phút mà sẽ mất một trong những siêu máy tính nhanh nhất hiện nay 10 septillion (10^25) năm.

xAI chính thức công bố ra mắt mô hình tạo hình ảnh mới của mình. Nó được gọi là Aurora, nhưng Elon cho biết Aurora chỉ là tên nội bộ và sẽ sớm được bỏ. Theo báo cáo, nó sẽ được triển khai cho tất cả người dùng X trong vòng một tuần.

https://x.com/elonmusk/status/1866171570193838198?s=46

Amazon ra mắt Phòng thí nghiệm AGI San Francisco mới. Phòng thí nghiệm sẽ do các thành viên nhóm Adept trước đây lãnh đạo, tập trung vào phát triển các agent AI có khả năng thực hiện ‘hành động trong thế giới thực’.

https://x.com/amazon/status/1866227273298497979?s=46

Lindy công bố tính năng cuộc gọi điện thoại cho nền tảng AI agent không cần lập trình. Giờ đây, bạn có thể xây dựng các agent AI mà không cần viết mã, có thể nhận cuộc gọi cho bạn và gửi cho bạn bản tóm tắt.

https://x.com/altimor/status/1866198341803249685?s=46

Các nhà nghiên cứu Meta FAIR giới thiệu COCONUT. Đây là một phương pháp lập luận AI mới thú vị cho phép các mô hình AI suy nghĩ tự nhiên hơn thay vì thông qua các bước ngôn ngữ cứng nhắc, dẫn đến hiệu suất tốt hơn trong các nhiệm vụ giải quyết vấn đề phức tạp.

https://x.com/omarsar0/status/1866518791733342563?s=46

Tin Tức AI Mới Nhất

Đây là một tuần đầy ấn tượng với những tiến bộ trong lĩnh vực AI và robotics. Brett Adcock đã tổng hợp mọi thông báo từ Anthropic, Ideogram, Figure, Genmo, Runway, Microsoft, Google DeepMind, OpenAI, UCLA, Apple, Clone Robotics và nhiều công ty khác. Đây là tất cả những gì bạn cần biết và cách hiểu nó:

Anthropic: Khả Năng Mới của Claude

Anthropic thông báo rằng Claude hiện có thể sử dụng máy tính thông qua tương tác trực tiếp với màn hình (trong phiên bản beta công khai). Mô hình AI có thể di chuyển con trỏ, nhấp chuột và gõ phím bằng cách phân tích ảnh chụp màn hình, đạt 14,9% trên các chuẩn mực OSWorld—gấp đôi hiệu suất của mô hình AI tốt nhất tiếp theo.

https://video.twimg.com/ext_tw_video/1848736846877974528/pu/vid/avc1/1920x1080/1Jyk17z9w9LdvORq.mp4?tag=14

Ideogram: Giới Thiệu Canvas

Ideogram đã ra mắt Canvas, một nền tảng sáng tạo cho việc tạo và chỉnh sửa hình ảnh bằng AI. Hệ thống này có tính năng Magic Fill để chỉnh sửa khu vực chính xác và Extend để mở rộng hình ảnh vượt qua các đường viền. Cả hai công cụ này duy trì một phong cách thống nhất qua các sửa đổi.

https://video.twimg.com/ext_tw_video/1848754215964876801/pu/vid/avc1/1280x720/zJ4JqADPhMOqi-v3.mp4?tag=12

Figure: Khuôn Viên Mới cho Robot

Figure đang thiết lập một khuôn viên mới cho robot tại khu vực Bay Area, để mở rộng quy mô hoạt động tại địa điểm mới này. Khuôn viên này đã lâu là một văn phòng mơ ước của nhiều người.

https://twitter.com/adcock_brett/status/1850206054719930377

Genmo: Ra Mắt Mochi 1

Startup AI Genmo vừa ra mắt Mochi 1, một mô hình tạo video mã nguồn mở mới. Startup này tuyên bố rằng nó cạnh tranh với các đối thủ đóng như Runway, Pika và Kling, trong khi được cung cấp miễn phí cho các nhà phát triển và nhà nghiên cứu—một chiến thắng cho mã nguồn mở.

https://video.twimg.com/ext_tw_video/1848745801926795264/pu/vid/avc1/1920x1080/zCXCFAyOnvznHUAf.mp4?tag=14

Runway: Hệ Thống AI Act-One

Runway giới thiệu Act-One, một hệ thống AI mới tạo ra các hoạt cảnh nhân vật biểu cảm từ một video và hình ảnh đơn lẻ. Công nghệ này chuyển đổi các biểu diễn khuôn mặt thành các nhân vật được tạo ra mà không cần ghi lại chuyển động, duy trì các biểu cảm và chuyển động tinh tế.

https://video.twimg.com/ext_tw_video/1848783440801333248/pu/vid/avc1/1280x720/2EyYj6GjSpT_loQf.mp4?tag=12

Microsoft: Copilot và Dynamics 365

Microsoft đã công bố các khả năng mới cho Copilot và Dynamics 365. Các tính năng mới cho phép người dùng tạo ra các agent (đại diện) của riêng họ để hoạt động độc lập và nâng cao quy trình. Microsoft gọi đây là “các ứng dụng mới cho thế giới được hỗ trợ bởi AI.”

https://video.twimg.com/amplify_video/1848816623177646080/vid/avc1/1920x1080/WPht9vg_VYHO2Duk.mp4?tag=16

Google DeepMind: SynthID

Google DeepMind đã tiết lộ SynthID, một hệ thống đánh dấu watermark nhúng và phát hiện các dấu hiệu không thể nhận thấy trong hình ảnh, âm thanh, văn bản và video do AI tạo ra. Bộ công cụ beta này tích hợp với các sản phẩm của Google để giúp người dùng xác định nội dung AI trên nhiều loại phương tiện.

https://video.twimg.com/ext_tw_video/1849103528813285376/pu/vid/avc1/1280x720/G5K0TaljbmDqO-lP.mp4?tag=12

UCLA: Mô Hình Nền Tảng cho Hình Ảnh Y Tế 3D

Các nhà nghiên cứu UCLA đã phát triển một mô hình nền tảng mới phân tích hình ảnh y tế 3D như MRI và CT tuân thủ tốc độ của các chuyên gia. Mô hình AI này có thể chuyển đổi học tập qua các cơ quan khác nhau và loại hình ảnh, thể hiện sự linh hoạt ấn tượng.

https://video.twimg.com/tweet_video/GaaQwd0WsAALuHv.mp4

Apple: Tích Hợp ChatGPT

Apple ra mắt tích hợp ChatGPT trong phiên bản beta cho nhà phát triển, đưa AI này vào Siri, Visual Intelligence, và Writing Tools. Người dùng hiện có thể truy vấn hình ảnh và tệp tin trên toàn hệ thống iOS và tương tác với môi trường thông qua Camera Control. Đây là một ví dụ:

https://video.twimg.com/ext_tw_video/1849279472111079424/pu/vid/avc1/720x720/uPfsEc6ZhVMwzZZy.mp4?tag=12

OpenAI: Mô Hình sCM

OpenAI giới thiệu sCM, một mô hình nhất quán thời gian liên tục đơn giản hóa, đạt chất lượng của các mô hình khuếch tán chỉ trong hai bước lấy mẫu. Mô hình 1,5 tỷ tham số này tạo ra hình ảnh chất lượng cao trong 0,11 giây, tăng tốc 50 lần so với cách tiếp cận truyền thống.

https://twitter.com/OpenAI/status/1849139783362347293

Haiper: Nền Tảng Tạo Video

Startup AI Haiper đã ra mắt phiên bản 2 của nền tảng tạo video. Nó được cung cấp miễn phí và có khả năng tạo đoạn clip ngắn, hoạt hình hình ảnh và repainting video. Việc tạo video AI có khả năng sẽ thấy bước nhảy đáng kể, tương tự như đã được quan sát trong việc tạo hình ảnh AI.

https://video.twimg.com/amplify_video/1848383786473402368/vid/avc1/1920x1080/NsjPgU0sAfHGoOKc.mp4?tag=16

EngineAI: Robot Humanoid SE01

EngineAI đã tiết lộ robot SE01, một robot humanoid đạt được bước đi tự nhiên thông qua các mô đun khớp nối và mạng nơ-ron tiên tiến. Robot này kết hợp reinforcement và imitation learning để tạo ra các bước đi ổn định, nhanh hơn, khác biệt so với các chuyển động robot truyền thống.

https://video.twimg.com/ext_tw_video/1849351674361757696/pu/vid/avc1/1280x720/D429gHgPIpumy_IL.mp4?tag=12

Clone Robotics: Torso

Clone Robotics đã giới thiệu Torso, một android với hai tay được vận hành bởi các cơ nhân tạo. Hệ thống humanoid này có khớp nối chính xác về mặt giải phẫu trên vai, cổ và tay, với hệ thống điều khiển van tích hợp vào cấu trúc xương sườn.

https://video.twimg.com/ext_tw_video/1849179768849334272/pu/vid/avc1/1280x720/R9Epq3PetEfBgCRU.mp4?tag=12

Các Nhà Nghiên Cứu Cambridge: Paleo-Robots

Các nhà nghiên cứu Cambridge đã giới thiệu ‘paleo-robots’ để nghiên cứu cách cá cổ đại chuyển từ bơi sang đi bộ từ 390 triệu năm trước. Các mô hình robot này, được lấy cảm hứng từ mudskippers và các hóa thạch, nhằm mục đích xác nhận các lý thuyết về sự tiến hóa của động vật trên cạn thời kỳ đầu.