Hiện nay để lưu lại những kỉ niệm, khoảnh khắc thì việc chụp ảnh là đơn giản nhất. Chỉ cần vài giây là bạn hoàn toàn có thể ghi lại những phút giây vui vẻ, đáng yêu của con trẻ. Ngày nay khi nhu cầu của người sử dụng ngày càng nhiều, một bức ảnh chỉ đứng yên không thật sự hấp dẫn. Họ muốn bức ảnh có thể chuyển động ngắn, di chuyển theo nhiều sắc thái khác nhau. Qua đó giúp cho bức ảnh trở nên chân thật, hấp dẫn hơn. Mới đây một ứng dụng có tên Speaking Portrait ra đời giúp phù phép bức ảnh. Ứng dụng này giúp bức ảnh có thể di chuyển thành một video ngắn để người dùng trải nghiệm.
Mục Lục
Speaking Portrait giúp biến ảnh tĩnh thành video chuyển động
Trên thế giới hiện nay đang có khá nhiều phiên bản khác nhau của ứng dụng. Mỗi một phiên bản đều có những tính năng riêng biệt mang tới trải nghiệm mới cho người dùng. Hiện nay ứng dụng này đang có tính phổ biến trên toàn thế giới. Đây là ứng dụng có sử dụng phần mềm AI để đọc, dự đoán các chuyển động trong bức ảnh. Trên thế giới hiện nay đang có những phần mềm giả tạo mang tới trải nghiệm không tốt cho người dùng.
Ứng dụng Speaking Portrait có thể làm cho các bức ảnh chuyển động và nói chuyện dựa trên một đoạn video nguồn. Đầu năm nay, nhà phát triển D-ID gây xôn xao với Deep Nostalgia – giúp những bức ảnh thời xưa biết “động đậy” trong giây lát. Tại sự kiện TechCrunch Disrupt cuối tháng 9, công ty có trụ sở tại Israel đã giới thiệu thế hệ công nghệ tiếp theo của Deep Nostalgia, mang tên Speaking Portrait. Ứng dụng mới có khả năng biến ảnh tĩnh thành video chuyển động và nói bất cứ điều gì người dùng muốn.
Các phiên bản của Speaking Portrait
Speaking Portrait có hai phiên bản. Đầu tiên là Single Portrait giúp chuyển một bức ảnh thành video dạng chân dung biết nói. Tuy nhiên, chuyển động của phiên bản này chỉ giới hạn ở phần đầu, bất kỳ thứ gì khác trong nền vẫn ở trạng thái tĩnh, do đó khả năng sử dụng vào mục đích giả mạo khá thấp.
Bản nâng cao hơn là Trained Character. Ngoài một bức ảnh, phần mềm yêu cầu thêm một video dài 10 phút quay lại một nhóm chuyển động cụ thể cùng giọng nói thông qua một đoạn thoại được chuẩn bị sẵn. Kết quả là phiên bản này trông thực hơn nhiều so với Single Portrait nhờ khả năng xác định vật thể trong nền và tạo ra chuyển động cơ thể của người, bao gồm cả cánh tay và bàn tay của họ.
Tính năng làm ảnh tĩnh động đậy trên Deep Nostalgia giống như một công cụ quảng cáo. Qua đó thu hút người dùng đến với trang web bảo tồn phả hệ MyHeritage. Trong khi đó, Speaking Portrait có tiềm năng hơn nhiều. Nó không chỉ dành cho những ai muốn xây dựng nhân vật ảo thuyết trình chuyên nghiệp. Việc thuyết trình bằng nhiều thứ tiếng trong các cuộc họp trực tuyến. Công nghệ này còn đảm bảo cho các hãng thông tấn. Họ luôn có người dẫn chương trình trực tiếp để cập nhật tin tức nóng hổi. Các thông tin sẽ được truyền tải ngay cả vào nửa đêm.
Phần mềm hứa hẹn nhiều tiềm năng trong tương lai
Đây là xu hướng ứng dụng đang được nhiều công ty AI theo đuổi. Với mục tiêu làm cho các bộ phim nước ngoài được lồng tiếng trông tự nhiên hơn. Bằng cách đảm bảo chuyển động miệng và khuôn mặt khớp với lời thoại.
Dù vẫn còn nhiều lý do để lo ngại rằng deepfake có thể bị sử dụng vào mục đích giả mạo. Công nghệ này hiện đã đạt đến một trình độ mới và trở nên dễ sử dụng hơn. Đồng thời cho thấy nhiều lợi ích tiềm năng nếu được sử dụng đúng cách.