Tencent ra mắt công cụ AI biến hình ảnh thành video sinh động

Tencent Holdings, một trong những tập đoàn internet hàng đầu tại Trung Quốc, vừa công bố việc phát triển một mô hình trí tuệ nhân tạo (AI) mới có khả năng chuyển đổi hình ảnh thành video. Động thái này đặt họ vào tình trạng cạnh tranh trực tiếp với các chatbot AI như ChatGPT của OpenAI và Sora.

Một công cụ mới để tạo hoạt ảnh, được gọi là Follow-Your-Click, đã được phát hành trên GitHub của Microsoft. Công cụ này cho phép người dùng nhấp chuột vào các điểm trên một bức tranh và cung cấp một mô tả ngắn về cách họ muốn hình ảnh chuyển động. Sau đó, công cụ sẽ biến hình ảnh tĩnh thành video hoạt ảnh ngắn.

Follow-Your-Click ra đời để giải quyết vấn đề mà các công cụ chuyển đổi hình ảnh thành video khác thường gặp phải. Thay vì di chuyển toàn bộ cảnh, công cụ này tập trung vào các đối tượng cụ thể trong hình ảnh.

Theo mô tả cách thức hoạt động của công cụ, ví dụ, nếu có một bức ảnh về con chim và người dùng muốn nó “vỗ cánh”, công cụ có thể biến nó thành một video với con chim màu sắc cầu vồng vẫy cánh mượt mà. Hoặc nếu có một hình ảnh về cô gái ở ngoài trời và người dùng muốn mô tả là “giông bão”, công cụ có thể biến bầu trời thành một cảnh với tia sét lóe sáng ở phía sau.

Dự án này là sản phẩm của sự hợp tác giữa nhóm Hunyuan của Tencent và hai trong số những trường đại học hàng đầu tại Bắc Kinh, Trung Quốc là Đại học Khoa học và Công nghệ Hồng Kông và Đại học Thanh Hoa.

Tencent dự định sẽ phát hành toàn bộ mã nguồn cho công cụ này vào tháng 4. Tuy nhiên, người dùng đã có thể trải nghiệm phiên bản dùng thử trên GitHub.

Nhóm nghiên cứu cho biết: ‘Mô hình chuyển đổi hoạt ảnh của chúng tôi cung cấp sự kiểm soát đơn giản nhưng chính xác cho người dùng và hiệu suất tạo ra cũng tốt hơn so với các phương pháp trước đó’.

Kể từ khi OpenAI, với sự hỗ trợ từ Microsoft, tung ra mô hình Sora chuyển đổi văn bản thành video, việc tạo video đã trở thành một chủ đề hot trong lãnh vực công nghệ. Sự thành công nổi bật từ mô hình này đã tạo ra một làn sóng mới trong ngành công nghiệp trí tuệ nhân tạo của Trung Quốc, khi các nhà nghiên cứu đang nỗ lực để bắt kịp xu hướng này.

Các đối thủ của Tencent tại Trung Quốc cũng đã tham gia vào cuộc đua công nghệ hoạt ảnh. Tập đoàn Alibaba gần đây đã giới thiệu một công cụ tạo video chân dung mang tên EMO, có khả năng chuyển đổi hình ảnh và âm thanh thành video với khả năng hát và nói chuyện.

Trước Follow-Your-Click, Tencent đã phát hành VideoCrafter2, một bộ công cụ chỉnh sửa và tạo video từ văn bản vào đầu năm nay. Đây là phiên bản cập nhật của VideoCrafter1, được ra mắt vào tháng 10/2023, nhưng giới hạn chỉ tạo video có độ dài 2 giây.

Cảm ơn bạn đã đọc bài tổng hợp của ISAO

Nguồn: sohuutritue.net.vn