Whisk: Công cụ AI mới cho phép tạo hình ảnh từ ảnh có sẵn

Hôm nay, Google đã ra mắt thí nghiệm AI thế hệ mới nhất của họ tại @labsdotgoogle: Whisk. Thay vì tạo ra hình ảnh bằng các đoạn văn bản dài và chi tiết, Whisk cho phép người dùng sử dụng hình ảnh làm đầu vào. Người dùng chỉ cần kéo và thả hình ảnh vào, sau đó bắt đầu sáng tạo.

https://video.twimg.com/amplify_video/1868781321830432768/vid/avc1/1920x1080/aYtg7_ZsWu8pqzbM.mp4?tag=16

@labsdotgoogle Whisk cho phép người dùng nhập hình ảnh cho chủ thể, một hình ảnh cho khung cảnh và một hình ảnh khác cho phong cách. Sau đó, người dùng có thể kết hợp chúng để tạo ra một sản phẩm độc đáo của riêng mình, từ một con thú nhồi bông kỹ thuật số đến một chiếc ghim tráng men hoặc sticker. Tìm hiểu thêm tại 🔽 goo.gle/4iz2eTo

Với Whisk, Google đã mang đến một cách tiếp cận mới trong việc tạo ra hình ảnh bằng AI. Thay vì dựa vào các mô tả bằng văn bản, công cụ này cho phép người dùng sử dụng trực tiếp hình ảnh làm nguồn cảm hứng và hướng dẫn cho quá trình sáng tạo. Điều này mở ra nhiều khả năng mới cho các nhà thiết kế, nghệ sĩ và những người sáng tạo nội dung, giúp họ dễ dàng biến ý tưởng thành hiện thực hơn.

Whisk có thể được sử dụng để tạo ra nhiều loại hình ảnh khác nhau, từ những món đồ chơi ảo đến các sản phẩm thực tế như ghim cài áo hay sticker. Điều này cho thấy tiềm năng ứng dụng rộng rãi của công cụ trong nhiều lĩnh vực, từ thiết kế sản phẩm đến marketing và quảng cáo.

Với sự ra mắt của Whisk, Google tiếp tục khẳng định vị thế của mình trong lĩnh vực AI sáng tạo, đồng thời cung cấp cho cộng đồng một công cụ mới để khám phá và mở rộng khả năng sáng tạo của họ.

Tin Tức AI Mới Nhất

Đây là một tuần đầy ấn tượng với những tiến bộ trong lĩnh vực AI và robotics. Brett Adcock đã tổng hợp mọi thông báo từ Anthropic, Ideogram, Figure, Genmo, Runway, Microsoft, Google DeepMind, OpenAI, UCLA, Apple, Clone Robotics và nhiều công ty khác. Đây là tất cả những gì bạn cần biết và cách hiểu nó:

Anthropic: Khả Năng Mới của Claude

Anthropic thông báo rằng Claude hiện có thể sử dụng máy tính thông qua tương tác trực tiếp với màn hình (trong phiên bản beta công khai). Mô hình AI có thể di chuyển con trỏ, nhấp chuột và gõ phím bằng cách phân tích ảnh chụp màn hình, đạt 14,9% trên các chuẩn mực OSWorld—gấp đôi hiệu suất của mô hình AI tốt nhất tiếp theo.

https://video.twimg.com/ext_tw_video/1848736846877974528/pu/vid/avc1/1920x1080/1Jyk17z9w9LdvORq.mp4?tag=14

Ideogram: Giới Thiệu Canvas

Ideogram đã ra mắt Canvas, một nền tảng sáng tạo cho việc tạo và chỉnh sửa hình ảnh bằng AI. Hệ thống này có tính năng Magic Fill để chỉnh sửa khu vực chính xác và Extend để mở rộng hình ảnh vượt qua các đường viền. Cả hai công cụ này duy trì một phong cách thống nhất qua các sửa đổi.

https://video.twimg.com/ext_tw_video/1848754215964876801/pu/vid/avc1/1280x720/zJ4JqADPhMOqi-v3.mp4?tag=12

Figure: Khuôn Viên Mới cho Robot

Figure đang thiết lập một khuôn viên mới cho robot tại khu vực Bay Area, để mở rộng quy mô hoạt động tại địa điểm mới này. Khuôn viên này đã lâu là một văn phòng mơ ước của nhiều người.

https://twitter.com/adcock_brett/status/1850206054719930377

Genmo: Ra Mắt Mochi 1

Startup AI Genmo vừa ra mắt Mochi 1, một mô hình tạo video mã nguồn mở mới. Startup này tuyên bố rằng nó cạnh tranh với các đối thủ đóng như Runway, Pika và Kling, trong khi được cung cấp miễn phí cho các nhà phát triển và nhà nghiên cứu—một chiến thắng cho mã nguồn mở.

https://video.twimg.com/ext_tw_video/1848745801926795264/pu/vid/avc1/1920x1080/zCXCFAyOnvznHUAf.mp4?tag=14

Runway: Hệ Thống AI Act-One

Runway giới thiệu Act-One, một hệ thống AI mới tạo ra các hoạt cảnh nhân vật biểu cảm từ một video và hình ảnh đơn lẻ. Công nghệ này chuyển đổi các biểu diễn khuôn mặt thành các nhân vật được tạo ra mà không cần ghi lại chuyển động, duy trì các biểu cảm và chuyển động tinh tế.

https://video.twimg.com/ext_tw_video/1848783440801333248/pu/vid/avc1/1280x720/2EyYj6GjSpT_loQf.mp4?tag=12

Microsoft: Copilot và Dynamics 365

Microsoft đã công bố các khả năng mới cho Copilot và Dynamics 365. Các tính năng mới cho phép người dùng tạo ra các agent (đại diện) của riêng họ để hoạt động độc lập và nâng cao quy trình. Microsoft gọi đây là “các ứng dụng mới cho thế giới được hỗ trợ bởi AI.”

https://video.twimg.com/amplify_video/1848816623177646080/vid/avc1/1920x1080/WPht9vg_VYHO2Duk.mp4?tag=16

Google DeepMind: SynthID

Google DeepMind đã tiết lộ SynthID, một hệ thống đánh dấu watermark nhúng và phát hiện các dấu hiệu không thể nhận thấy trong hình ảnh, âm thanh, văn bản và video do AI tạo ra. Bộ công cụ beta này tích hợp với các sản phẩm của Google để giúp người dùng xác định nội dung AI trên nhiều loại phương tiện.

https://video.twimg.com/ext_tw_video/1849103528813285376/pu/vid/avc1/1280x720/G5K0TaljbmDqO-lP.mp4?tag=12

UCLA: Mô Hình Nền Tảng cho Hình Ảnh Y Tế 3D

Các nhà nghiên cứu UCLA đã phát triển một mô hình nền tảng mới phân tích hình ảnh y tế 3D như MRI và CT tuân thủ tốc độ của các chuyên gia. Mô hình AI này có thể chuyển đổi học tập qua các cơ quan khác nhau và loại hình ảnh, thể hiện sự linh hoạt ấn tượng.

https://video.twimg.com/tweet_video/GaaQwd0WsAALuHv.mp4

Apple: Tích Hợp ChatGPT

Apple ra mắt tích hợp ChatGPT trong phiên bản beta cho nhà phát triển, đưa AI này vào Siri, Visual Intelligence, và Writing Tools. Người dùng hiện có thể truy vấn hình ảnh và tệp tin trên toàn hệ thống iOS và tương tác với môi trường thông qua Camera Control. Đây là một ví dụ:

https://video.twimg.com/ext_tw_video/1849279472111079424/pu/vid/avc1/720x720/uPfsEc6ZhVMwzZZy.mp4?tag=12

OpenAI: Mô Hình sCM

OpenAI giới thiệu sCM, một mô hình nhất quán thời gian liên tục đơn giản hóa, đạt chất lượng của các mô hình khuếch tán chỉ trong hai bước lấy mẫu. Mô hình 1,5 tỷ tham số này tạo ra hình ảnh chất lượng cao trong 0,11 giây, tăng tốc 50 lần so với cách tiếp cận truyền thống.

https://twitter.com/OpenAI/status/1849139783362347293

Haiper: Nền Tảng Tạo Video

Startup AI Haiper đã ra mắt phiên bản 2 của nền tảng tạo video. Nó được cung cấp miễn phí và có khả năng tạo đoạn clip ngắn, hoạt hình hình ảnh và repainting video. Việc tạo video AI có khả năng sẽ thấy bước nhảy đáng kể, tương tự như đã được quan sát trong việc tạo hình ảnh AI.

https://video.twimg.com/amplify_video/1848383786473402368/vid/avc1/1920x1080/NsjPgU0sAfHGoOKc.mp4?tag=16

EngineAI: Robot Humanoid SE01

EngineAI đã tiết lộ robot SE01, một robot humanoid đạt được bước đi tự nhiên thông qua các mô đun khớp nối và mạng nơ-ron tiên tiến. Robot này kết hợp reinforcement và imitation learning để tạo ra các bước đi ổn định, nhanh hơn, khác biệt so với các chuyển động robot truyền thống.

https://video.twimg.com/ext_tw_video/1849351674361757696/pu/vid/avc1/1280x720/D429gHgPIpumy_IL.mp4?tag=12

Clone Robotics: Torso

Clone Robotics đã giới thiệu Torso, một android với hai tay được vận hành bởi các cơ nhân tạo. Hệ thống humanoid này có khớp nối chính xác về mặt giải phẫu trên vai, cổ và tay, với hệ thống điều khiển van tích hợp vào cấu trúc xương sườn.

https://video.twimg.com/ext_tw_video/1849179768849334272/pu/vid/avc1/1280x720/R9Epq3PetEfBgCRU.mp4?tag=12

Các Nhà Nghiên Cứu Cambridge: Paleo-Robots

Các nhà nghiên cứu Cambridge đã giới thiệu ‘paleo-robots’ để nghiên cứu cách cá cổ đại chuyển từ bơi sang đi bộ từ 390 triệu năm trước. Các mô hình robot này, được lấy cảm hứng từ mudskippers và các hóa thạch, nhằm mục đích xác nhận các lý thuyết về sự tiến hóa của động vật trên cạn thời kỳ đầu.

Exit mobile version