Lĩnh vực âm nhạc AI đang phát triển với tốc độ chóng mặt với sự ra đời của hàng loạt các công cụ thông minh như Suno và Udio, và chắc chắn Google cũng không thể nào bỏ qua một thị trường đầy tiềm năng bằng cách cho ra mắt Google Lyria 3, mô hình tạo nhạc bằng trí tuệ nhân tạo tiên tiến nhất của mình, trực tiếp trong ứng dụng Gemini. Người dùng chỉ cần nhập vài dòng mô tả, hoặc thậm chí chỉ một hình ảnh, hệ thống từ đó sẽ tạo ra một bản nhạc dài khoảng 30 giây, có lời hát tự động, phối khí đầy đủ và cả ảnh bìa đi kèm. Hãy cùng VJ360.vn tìm hiểu chi tiết về lần ra mắt này trong bài viết dưới đây.
Bước tiến lớn của Google khi ra mắt Lyria 3
Nếu anh em còn nhớ đến những bản demo của MusicLM từ năm 2023, một dự án mà Google đã từng hỗ trợ, và so sánh với Lyria 3 lúc này, sẽ thấy đây là một mô hình ở một đẳng cấp hoàn toàn khác. Google không còn chỉ tạo những đoạn nhạc thử nghiệm thô sơ, mà giờ đây nó đã có thể dựng hẳn một ca khúc hoàn chỉnh với đầy đủ vocal, lời bài hát và nhiều lớp nhạc cụ chỉ từ một đoạn mô tả ngắn.

Google cho biết Lyria 3 đã được cải thiện ở ba điểm chính:
- Tự động viết lời dựa trên prompt
- Cho phép kiểm soát tốt hơn về phong cách, chất giọng và nhịp độ
- Đầu ra tự nhiên và phức tạp hơn về mặt âm nhạc

Anh em có thể mô tả một thể loại, một tâm trạng, kỷ niệm, hoặc thậm chí là một câu chuyện riêng tư, và từ đó hệ thống sẽ tạo ra một đoạn nhạc hoàn chỉnh dài 30 giây. Ngoài văn bản, Lyria 3 còn phân tích hình ảnh và video tải lên để tạo soundtrack phù hợp với tông màu hoặc cảm xúc.
Mỗi bản nhạc được tạo ra đều đi kèm ảnh bìa được tạo bởi Nano Banana cũng thuộc sở hữu của Google, và có thể được tải xuống hoặc chia sẻ bằng link.
Lyria 3 có thực sự hữu ích cho nhà sáng tạo?
Rõ ràng rằng Lyria 3 không sinh ra để soạn nhạc cho phim điện ảnh dài tập do đoạn nhạc chỉ kéo dài 30 giây. Google cũng định vị đây là công cụ sáng tạo cá nhân, có thể giúp anh em thể hiện bản thân theo một cách khác biệt, hơn là nền tảng sản xuất âm nhạc chuyên nghiệp nhằm tạo ra kiệt tác âm nhạc.

Tuy nhiên, vẫn có khá nhiều tình huống mà các đoạn nhạc được tạo ra nhanh chóng bằng công nghệ trí tuệ nhân tạo trở nên hữu ích trong quá trình làm phim. AI có thể được dùng để tạo ra các bản nhạc tạm thời cho các bản dựng thô, tham khảo tâm trạng trong giai đoạn tiền kỳ, tạo nội dung mạng xã hội để quảng bá phim hoặc nhạc nền cho các bản thuyết trình. Khả năng tải lên một khung hình hoặc video ngắn và nhận về âm thanh ăn khớp chỉ sau vài giây có thể tiết kiệm không ít thời gian trong giai đoạn phát triển ý tưởng.

Tất nhiên khi so với các đối thủ khác, ví dụ như Suno cho phép tạo bài hát dài nhiều phút với cấu trúc bài hát hoàn chỉnh, hoặc Udio cung cấp các tính năng như thanh trượt điều chỉnh cường độ lặp lại và negative prompt, Lyria 3 vẫn còn hạn chế. Google dường như đang nhắm đến một nhóm người dùng phổ thông hơn, ít nhất là ở thời điểm hiện tại.

SynthID và tính minh bạch trong nội dung
Một điểm Google nhấn mạnh là tính minh bạch. Mỗi bản nhạc được tạo ra từ Lyria 3 đều được nhúng SynthID, một công nghệ giúp đánh dấu bản quyền âm thanh không thể nhận biết của Google Deepmind để xác định nội dung do AI tạo ra. Dấu nhận diện này sẽ được chèn ngay từ lúc tạo nội dung và có thể kiểm tra lại sau đó.

Gemini cũng được mở rộng khả năng xác minh âm thanh. Anh em có thể tải lên một file và hỏi liệu nó có được tạo bằng AI của Google hay không. Trong bối cảnh ngành công nghiệp ngày càng lo ngại về nguồn gốc của nội dung, đây là bước đi đáng chú ý.
Bảo vệ bản quyền của nghệ sĩ
Nhà phát triển khi ra mắt Google Lyria 3 chia sẻ rằng mô hình được xây dựng theo hướng khuyến khích sáng tạo, tránh bắt chước nghệ sĩ cụ thể. Nếu anh em nhập tên một nghệ sĩ nổi tiếng, hệ thống sẽ hiểu đó là cảm hứng phong cách chứ không cố tái tạo giọng hát hay âm thanh đặc trưng.

Google cũng khẳng định rằng họ có bộ lọc để đối chiếu đầu ra với nội dung hiện có, dù thừa nhận không có hệ thống nào hoàn hảo tuyệt đối. Trong bối cảnh căng thẳng đang diễn ra xung quanh dữ liệu sử dụng để huấn luyện AI, Google cần phải cẩn trọng hơn nữa vì trước đây ông lớn này đã từng huấn luyện các mô hình âm nhạc AI sử dụng các bản ghi âm có bản quyền trước khi xin bản quyền từ chủ sở hữu.

Gần đây, thỏa thuận cấp phép giữa Universal Music Group và Youtube, bao gồm cả các biện pháp bảo vệ xung quanh nội dung AI tạo sinh đã cho thấy ngành công nghiệp âm nhạc đang dần hướng đến các khuôn khổ rõi ràng hơn.
Mở rộng sang Youtube
Google ra mắt Lyria 3 không chỉ dừng lại ở mỗi trong Gemini. Mô hình này còn đứng sau tính năng Dream Track trên Youtube, cho phép anh em tạo nhạc nền tùy chỉnh cho các video dạng Shorts. Tính năng này trước đây chỉ có mặt tại Hoa Kỳ nay đang được mở rộng sang nhiều quốc gia.

Bước đi này giúp kết nối người dùng Gemini với hệ sinh thái Youtube, đặc biệt là các nhà sáng tạo nội dung ngắn. Với những ai làm phim và chủ yếu hoạt động trên Youtube, việc có một nguồn nhạc độc bản được tạo nhanh trong vài phút sẽ giúp cho quá trình làm việc trở nên nhanh chóng và cũng không cần lo lắng quá nhiều về vấn đề bản quyền.
Ngày ra mắt Lyria 3 và khả năng truy cập
Hiện Lyria 3 đã có thể truy cập được trên Gemini cho những người dùng từ 18 tuổi trở lên, hỗ trợ nhiều ngôn ngữ như tiếng Anh, Đức, Tây Ban Nha, Pháp, Hindi, Nhật, Hàn và Bồ Đào Nha.

Công cụ này đang được triển khai trước trên máy tính, sau đó sẽ có mặt trên ứng dụng di động. Nếu anh em sử dụng gói trả phí Google AI Plus, Pro và Ultra sẽ có hạn mức sử dụng cao hơn, dù Google vẫn chưa công bố con số cụ thể.














































