Trang chủ Thế kỷ của não bộ Công nghệ Thuật toán trí tuệ nhân tạo có thể đoán gương mặt của...

Thuật toán trí tuệ nhân tạo có thể đoán gương mặt của con người qua giọng nói

Các nhà khoa học tại Viện Công nghệ Massachusetts (MIT) của Mỹ đã phát triển thuật toán trí tuệ nhân tạo có thể phục dựng chân dung con người chỉ thông qua giọng nói.
Thuật toán trí tuệ nhân tạo có thể đoán gương mặt của con người qua giọng nói - Ảnh 1.

Khuôn mặt thật (ở trên) và khuôn mặt được AI tạo ra từ giọng nói (bên dưới) Ảnh: diyphotography.net

Chúng ta có thể biết rất nhiều điều về một người từ giọng nói của họ. Chẳng hạn, người đó là nam hay nữ, già hay trẻ, nhưng thuật toán trí tuệ nhân tạo (AI) mới mang tên Speech2Face còn có khả năng cao hơn thế. Speech2Face là mạng nơ-ron được đào tạo để nhận dạng một số đặc điểm trên gương mặt, từ đó phục dựng lại khuôn mặt của con người chỉ bằng cách lắng nghe giọng nói của họ.

Cụ thể, mạng nơ-ron này sẽ sử dụng hàng triệu video của người dùng trên YouTube hoặc Internet để thu thập các dữ liệu nhận dạng của con người dựa trên độ tuổi, giới tính và dân tộc. Từ đó, AI sẽ có nhiệm vụ tìm ra mối tương quan giữa các đặc điểm giọng nói và đặc điểm khuôn mặt.

‘Mô hình của chúng tôi được thiết kế để tạo ra các mối tương quan giữa các đặc điểm trên khuôn mặt và giọng nói theo một dữ liệu’, các nhà sáng tạo Speech2Face cho biết.

Nó có thể xác định khá chính xác hình dạng của mũi, xương gò má hoặc hàm của một người chỉ từ giọng nói của họ. Các nhà khoa học giải thích thuật toán AI có thể dựng lại những đặc điểm này vì cấu tạo của mũi và các xương trên khuôn mặt của con người quyết định cách phát âm của chúng ta.

Con người sẽ không trực tiếp tham gia vào quá trình này, vì các nhà nghiên cứu không cần phân loại thủ công bất kỳ dữ liệu nào. Sau khi được đào tạo, AI có thể tạo ra các bức ảnh chân dung giống người thật khi chỉ dựa trên bản ghi âm giọng nói. Thuật toán này hoạt động tốt hơn với các đoạn ghi âm dài hơn.

Ngoài ra, Speech2Face cũng có thể xác định chính xác sắc tộc của một người khi nghe giọng nói của họ chỉ trong vài mili giây,  do những người cùng sắc tộc có xu hướng sở hữu các đặc tính giống nhau.

Với thuật toán đầy hứa hẹn này, cơ quan thực thi pháp luật có thể sử dụng nó để tạo ra chân dung của kẻ tình nghi từ bằng chứng duy nhất là một đoạn ghi âm giọng nói.  Tuy nhiên, kẻ xấu cũng có thể sử dụng công nghệ tương tự cho các mục đích bất chính.

Trong một số trường hợp, thuật toán AI này vẫn gặp khó khăn trong việc xác định chân dung của người nói. Các yếu tố như trọng âm, ngôn ngữ nói và cao độ giọng nói khiến việc phục dựng chân dung trở nên khó khăn hơn. Do đó, việc dự đoán giới tính, tuổi tác hoặc dân tộc hoàn toàn không chính xác. Ví dụ, nam giới có giọng nói cao bị xác định nhầm là nữ, trong khi nữ có giọng trầm được xác định là nam.

Ngoài ra, trước những tranh cãi liên quan đến vấn đề bảo mật, các nhà nghiên cứu cho biết họ đã có những cân nhắc về quyền riêng tư và đạo đức xung quanh dự án này. Tất cả các kế hoạch sử dụng thực tế (nếu có) cần phải được kiểm tra cẩn thận.

Tuy nhiên, bất chấp những hạn chế này, Speech2Face hứa hẹn sẽ mang đến một cái nhìn đầy ấn tượng về tương lai của công nghệ trí tuệ nhân tạo.

Theo Tuổi Trẻ

CÁC TIN KHÁC

Điều ít biết về người phát minh ra bút xóa

Ngày nay, chiếc bút xóa đã không còn xa lạ gì với mọi người. Tuy nhiên, ít ai biết được người phát minh ra nó lại chính là một phụ nữ.

Nghiên cứu cho thấy AI giúp con người cảm thấy được lắng nghe

Một nghiên cứu mới được công bố trong Kỷ yếu của Viện Hàn lâm Khoa học Quốc gia Mỹ đã phát hiện rằng tin nhắn do trí tuệ nhân tạo (AI) phản hồi mang lại cảm giác được lắng nghe nhiều hơn tin nhắn do một người có khả năng giao tiếp non nớt.

Khả năng cuộc cách mạng thiết bị AI ‘khai tử’ điện thoại thông minh

Tham vọng của Humane là khai tử điện thoại thông minh hoặc ít nhất là giảm nhu cầu thiết bị đang được coi là thứ không thể thiếu trong cuộc sống hiện đại này.

Những cỗ máy ‘có một không hai’ trong lịch sử

Một số cỗ máy kỳ lạ nhất từng được thiết kế và chế tạo trong lịch sử nhân loại, từ máy tính cổ nhất thế giới của người Hy Lạp tới máy bay cánh chim của Leonardo da Vinci.

Tìm kiếm trên Internet sẽ thay đổi

Mô hình tìm kiếm thông tin trên Internet hiện nay chủ yếu xoay quanh Google; người dùng gõ từ khóa thông tin muốn tìm, bộ máy tìm kiếm của Google chạy hết tốc lực trong chốc lát trả về kết quả là những trang web chứa thông tin muốn tìm kiếm dựa trên nhiều tiêu chí.

Khoa học tìm ra cơ chế giúp não bộ biến trải nghiệm thành ký ức dài hạn, bạn cũng có thể thử xem sao

Theo định nghĩa, ký ức là quá trình diễn ra liên tục của hành động lưu giữ thông tin theo thời gian, chúng tạo nên một “kịch bản” mà dựa vào đó, một người có thể luận ra lý lẽ và hành động trong thực tế. Dù mô tả được đến vậy, với chúng ta ký ức vẫn chứa đựng vô vàn bí ẩn. Một số sự kiện được não bộ lưu giữ một cách rõ ràng dù chúng xảy ra đã lâu, trong khi đó có những sự kiện mờ dần vào quên lãng dù mới diễn ra ngày hôm qua. Để giải thích một phần bí ẩn kỳ lạ này, các nhà khoa học thực hiện một loạt các nghiên cứu, và báo cáo vừa mới được xuất bản trên tạp chí Science hồi cuối tháng Ba.

Bài viết nổi bật

Đại học Sư phạm TP.HCM ‘bắt tay’ doanh nghiệp công nghệ Việt thúc đẩy chuyển đổi số

Theo hợp tác mới ký kết với Viettel Solutions, Đại học Sư phạm TP.HCM sẽ cùng doanh nghiệp này xây dựng các giải pháp công nghệ trong giáo dục tập trung vào 4 nội dung chính.

Nhóm sinh viên trường ĐH Ngoại thương giành giải ‘Olympic Kinh tế lượng và ứng dụng’

Ngày 12/6, tại Học viện Tài chính diễn ra Chung khảo Hội thi khoa học sinh viên toàn quốc 'Olympic Kinh tế lượng và ứng dụng' lần thứ VII, năm 2022. Ban Giám khảo đã chọn ra nhóm sinh viên ĐH Ngoại thương TP. Hồ Chí Minh giành giải Đặc biệt.

Bài viết mới nhất

TOP 100 Hồng bảo Kỷ lục Thế giới tại Việt Nam (P.53) Hào Sĩ Phường (Thành phố Hồ Chí Minh): Chuyện đời trăm năm trong con hẻm nhỏ – [VIETKINGS-TOPPLUS đề cử]

(kyluc.vn) Tách biệt hoàn toàn với không khí ồn ào của phố thị, những ngôi nhà mang màu của thời gian, những nét văn hóa được gìn giữ qua hàng trăm năm ở con hẻm Hào Sĩ Phường đã đem đến một hình ảnh Sài Gòn đầy thi vị.

Ấn Độ giới thiệu mũ bảo hiểm có điều hòa cho cảnh sát giao thông

Mới đây, các sở cảnh sát ở nhiều bang của Ấn Độ đã giới thiệu mũ bảo hiểm có điều hòa nhiệt độ cho cảnh sát giao thông, qua đó hỗ trợ lực lượng làm nhiệm vụ trên đường có thể thoải mái hơn trong bối cảnh nắng nóng đang hoành hành trên khắp đất nước.

[WOWTIMES – VIETKINGS] Công ty Cổ phần Cảng Hải Phòng (1874-2024) – Vươn ra biển lớn – Top 100 đơn vị trên 100 tuổi còn hoạt động tại Việt Nam 2024 – P.11

(nienlich.vn) Cảng Hải Phòng được thành lập năm 1874, đây là cảng có lưu lượng hàng hóa thông qua lớn nhất ở phía Bắc Việt Nam, với hệ thống thiết bị hiện đại và cơ sở hạ tầng đáp ứng nhu cầu vận tải, thương mại quốc tế.

Di tích Thành cổ Quảng Trị (Quảng Trị) – TOP 10 khu di tích có giá trị lịch sử của Việt Nam được nhiều người biết đến (P.7) – [VIETKINGS-TOPPLUS – Hành trình TOP Việt Nam]

(kyluc.vn) Trong những thành cổ qua các triều đại phong kiến ở Việt Nam, Thành cổ Quảng Trị được nhắc đến nhiều nhất dù không phải là một kiến trúc đặc biệt. Nơi đây đã ghi dấu một trận chiến bi hùng của quân và dân ta, trở thành khúc tráng ca bất tử trong sự nghiệp giải phóng dân tộc, thống nhất non sông.

Ra mắt Viện Công nghệ Blockchain và Trí tuệ nhân tạo ABAII

Viện Công nghệ Blockchain và Trí tuệ nhân tạo ABAII đặt mục tiêu đào tạo, phổ cập công nghệ chuỗi khối và trí tuệ nhân tạo cho 1 triệu người tới 2023.

TOP 100 Hồng bảo Kỷ lục Thế giới tại Việt Nam (P.52) Chùa Vĩnh Nghiêm (Bắc Giang): Ngôi danh lam cổ tự nghìn năm – [VIETKINGS-TOPPLUS đề cử]

(kyluc.vn) Chùa Vinh Nghiêm còn được gọi là chùa Đức La, thuộc xã Trí Yên, huyện Yên Dũng, tỉnh Bắc Giang, cách trung tâm thành phố Bắc Giang khoảng 18km. Đây là trung tâm Phật giáo lớn thời Trần, nơi 3 vị Trúc Lâm Tam tổ (Trần Nhân Tông - Pháp La - Huyền Quang) từng trụ trì và mở trường thuyết pháp.