Tính năng tạo hình ảnh bằng văn bản sẽ được Google đem lên Gboard nhờ model AI Imagen?

Taskmaster 28/02/2023 10:24

Ứng dụng bàn phím Gboard của Google đã trở nên rất phổ biến trên các thiết bị Android, nhưng Google đang có kế hoạch tích hợp trí tuệ nhân tạo (AI) vào đó bằng cách trang bị cho Gboard khả năng tạo ra hình ảnh từ văn bản bằng các mô hình ngôn ngữ AI như DALL-E 2.

Tuy nhiên, Google không sử dụng DALL-E 2 mà sử dụng mô hình của riêng họ, gọi là Imagen, được mô tả là kết hợp sự hiểu biết sâu sắc về ngôn ngữ với mức độ hiểu biết về thực tế chưa từng có.


Google đã thực hiện một cuộc khảo sát về các công cụ này, bao gồm DALL-E 2, Imagen và Latent Diffusion, và kết quả và khả năng tái tạo hình ảnh từ văn bản của Imagen đã được đánh giá cao.

Nếu tích hợp Imagen vào Gboard, người dùng sẽ có thể tạo ra nhiều emoji hoặc hình ảnh thú vị hơn cho các cuộc trò chuyện. Hiện tại, Google đã có tính năng Emoji Kitchen, cho phép người dùng tùy chỉnh các emoji để tạo ra những sticker.


Tính năng text-to-image trên Gboard phiên bản beta mới nhất được 9to5Google dịch ngược mã phát hiện ra.

Tuy nhiên, Google vẫn chưa phát hành bất kỳ thử nghiệm rộng rãi nào về Imagen cho người dùng do lo ngại về tác động xã hội của các mô hình AI này. Trước đó, Google đã ra mắt Bard, nhưng vì một lỗi trong kết quả, nó đã gây ra mất mát tài sản vốn hóa 100 tỷ đô la của Alphabet - công ty mẹ của Google.

Google không ngừng đua tranh trong lĩnh vực AI, tích hợp các mô hình AI vào các sản phẩm và dịch vụ của mình, tuy nhiên, để hiểu rõ hơn về kế hoạch của họ, người dùng có thể cần chờ đến sự kiện Google I/O để có cái nhìn cụ thể hơn.

Viết bình luận