Tập đoàn NVIDIA mang AI tạo sinh đến hàng triệu người, với bộ xử lý Tensor Core, mô hình ngôn ngữ lớn, công cụ dành cho máy tính để bàn RTX và máy trạm

Tháng Bảy 11 07:30 2024

Nền tảng công nghệ trí tuệ nhân tạo (AI – Artificial Intelligence) hàng đầu được tăng cường hiệu năng nhờ vào card đồ họa (GPU) mới GeForce RTX SUPER, máy tính xách tay AI từ các nhà sản xuất hàng đầu.

Tại hội chợ Công nghệ CES tháng 1/2024, tập đoàn NVIDIA đã công bố card đồ họa dành cho máy tính để bàn GeForce RTX™ SUPER giúp tăng cao hiệu suất AI tạo sinh, máy tính xách tay AI mới từ các nhà sản xuất hàng đầu cũng như các công cụ và phần mềm trí tuệ nhân tạo được tăng tốc NVIDIA RTX™ dành cho cả nhà đầu tư và khách hàng.

Dựa trên vị thế dẫn đầu về máy tính để bàn trong nhiều thập kỷ, với hơn 100 triệu card đồ họa RTX thúc đẩy kỷ nguyên AI PC, tập đoàn NVIDIA hiện cung cấp những công cụ này để giúp khách hàng nâng cao trải nghiệm PC với AI tạo sinh: Tăng tốc thư viện mã nguồn mở NVIDIA TensorRT ™ của mô hình Stable Diffusion XL phổ biến giúp tạo ra hình ảnh từ văn bản, NVIDIA RTX Remix với các công cụ kết cấu AI tạo sinh, các microservice từ công cụ NVIDIA ACE và nhiều trò chơi khác sử dụng công nghệ DLSS 3 (2) với Frame Generation.
(1) Microservice: là một phương pháp để phát triển phần mềm, trong đó ứng dụng đượcx xây dựng thành một tập hợp các dịch vụ nhỏ, độc lập nhau. Mỗi dịch vụ đảm nhận một chức năng cụ thể và có thể triển khai độc lập. Các dịch vụ này có thể được viết bằng nhiều ngôn ngữ lập trình khác nhau và sử dụng các công nghệ lưu trữ dữ liệu khác nhau.
(2) DLSS (Deep Learning Super Sampling): là công nghệ render đột phá nhờ sự hỗ trợ của trí tuệ nhân tạo (AI), giúp tăng hiệu suất đồ họa bằng bộ xử lý AI trên nhân Tensor chuyên dụng trên card màn hình Nvidia GeForce RTX.
(3) Frame Generation: là công nghệ được NVIDIA tích hợp cùng với DLSS 3.0 giúp cho card đồ họa render thêm khung hình và nó tương thích với cả công nghệ từ Intel và AMD.

Bộ công cụ hợp nhất AI Workbench (4) dễ dàng sử dụng dành cho các nhà đầu tư trí tuệ nhân tạo, bản beta đã được phát hành vào cuối tháng 1/2024. Ngoài ra, thư viện mã nguồn mở NVIDIA TensorRT-LLM (TRT-LLM) giúp tăng tốc và tối ưu hóa hiệu suất suy luận của các mô hình ngôn ngữ lớn (LLM) mới nhất, hiện hỗ trợ nhiều mô hình được tối ưu hóa hơn dành cho máy tính để bàn. Được tăng tốc bởi TRT-LLM, Chat with RTX, một bản demo công nghệ của NVIDIA cũng phát hành trong tháng 1/2024, cho phép những khách hàng đam mê AI tương tác với ghi chú, tài liệu và nội dung của họ.
(4) AI Workbench: Là bộ công cụ hợp nhất để tạo, thử nghiệm và tùy biến các mô hình AI được đào tạo trước trên PC hoặc máy trạm.

Ông Jensen Huang, người sáng lập và là CEO của tập đoàn NVIDIA cho biết: “AI tạo sinh là quá trình chuyển đổi nền tảng quan trọng nhất trong lịch sử điện toán và sẽ biến đổi mọi ngành công nghiệp, bao gồm cả trò chơi. Với hơn 100 triệu máy tính để bàn và máy trạm RTX AI, NVIDIA là cơ sở cài đặt khổng lồ để các nhà đầu tư và game thủ tận hưởng sự kỳ diệu của AI tạo sinh.”

Việc chạy AI tạo sinh cục bộ trên PC là rất quan trọng đối với các ứng dụng có tính riêng tư, độ trễ và độ nhạy với chi phí. Nó đòi hỏi một lượng lớn các hệ thống sẵn sàng cho trí tuệ nhân tạo được cài đặt cũng như các công cụ dành cho nhà đầu tư phù hợp để điều chỉnh và tối ưu hóa các mô hình AI cho nền tảng máy tính để bàn.

Để đáp ứng những nhu cầu này, tập đoàn NVIDIA đang cung cấp những cải tiến trên toàn bộ công nghệ của mình, thúc đẩy những trải nghiệm mới và xây dựng trên hơn 500 ứng dụng và trò chơi PC hỗ trợ AI đã được công nghệ NVIDIA RTX tăng tốc.

Máy tính và máy trạm RTX AI

Card đồ họa NVIDIA RTX có khả năng chạy nhiều ứng dụng với hiệu suất cao nhất, giúp khai thác toàn bộ tiềm năng của AI tạo sinh trên PC. Lõi Tensor trong các GPU này tăng tốc đáng kể hiệu suất trí tuệ nhân tạo trên các ứng dụng yêu cầu khắt khe nhất để làm việc và giải trí.

Các mẫu card đồ họa dòng GeForce RTX 40 SUPER mới đã được công bố tại hội chợ Công nghệ CES, bao gồm GeForce RTX 4080 SUPER, 4070 Ti SUPER và 4070 SUPER cho hiệu suất AI cao nhất. GeForce RTX 4080 SUPER tạo video AI nhanh hơn 1,5 lần và hình ảnh nhanh hơn 1,7 lần so với GPU GeForce RTX 3080 Ti. Lõi Tensor trong SUPER GPU cung cấp tới 836 nghìn tỷ tính toán trong mỗi giây, mang lại khả năng biến đổi AI cho việc chơi game, sáng tạo và năng suất hàng ngày.

Các nhà sản xuất hàng đầu như: Acer, ASUS, Dell, HP, Lenovo, MSI, Razer và Samsung, đang phát hành một loạt các mẫu máy tính xách tay RTX AI mới, mang đến bộ sản phẩm đầy đủ để khách hàng khai thác công nghệ AI tạo sinh. Các hệ thống mới mang lại hiệu suất tăng từ 20x-60 lần so với việc sử dụng các bộ xử lý thần kinh, được bắt đầu xuất xưởng từ tháng 1/2024.

Máy trạm di động có card đồ họa RTX có thể chạy phần mềm NVIDIA AI Enterprise, bao gồm thư viện TensorRT và NVIDIA RAPIDS ™ để phát triển khoa học dữ liệu và AI tạo sinh đơn giản và an toàn. Mỗi card đồ họa NVIDIA A800 40GB Active bao gồm giấy phép sử dụng phần mềm NVIDIA AI Enterprise trong ba năm, cung cấp nền tảng phát triển máy trạm lý tưởng cho trí tuệ nhân tạo và khoa học dữ liệu.

Công cụ mới dành cho nhà đầu tư máy tính để bàn (PC) để xây dựng mô hình trí tuệ nhân tạo (AI)

Để giúp các nhà đầu tư nhanh chóng tạo, thử nghiệm và tùy chỉnh các mô hình AI tạo sinh và mô hình ngôn ngữ lớn LLM được đào tạo trước bằng cách sử dụng hiệu năng và dung lượng bộ nhớ của PC-class, tập đoàn NVIDIA đã công bố bộ công cụ hợp nhất NVIDIA AI Workbench.

Bộ công cụ AI Workbench đã có bản beta vào cuối tháng 01/2024, cung cấp quyền truy cập vào các kho lưu trữ phổ biến như: Hugging Face, GitHub và NVIDIA NGC, cùng với giao diện người dùng đơn giản cho phép các nhà đầu tư dễ dàng tái tạo, cộng tác và di chuyển các dự án.

Các dự án có thể được mở rộng quy mô đến hầu hết mọi nơi — cho dù là trung tâm dữ liệu, đám mây public cloud hay NVIDIA DGX Cloud — rồi đưa trở lại hệ thống RTX cục bộ trên máy tính để bàn hoặc máy trạm để suy luận và tùy chỉnh ánh sáng.

Kết hợp cùng tập đoàn HP, tập đoàn NVIDIA thực hiện đơn giản hóa việc phát triển mô hình trí tuệ nhân tạo bằng cách tích hợp NVIDIA AI Foundation Models and Endpoints (5), bao gồm các mô hình AI được tăng tốc RTX và bộ công cụ phát triển phần mềm, HP AI Studio – một nền tảng tập trung cho ngành khoa học dữ liệu. Điều này cho phép khách hàng dễ dàng tìm kiếm, nhập và triển khai các mô hình được tối ưu hóa trên máy tính để bàn và đám mây.
(5) Foundation Model: được gọi là ‘mô hình nền tảng’. Là các mạng nơ-ron nhân tạo AI được đào tạo trên các bộ dữ liệu khổng lồ chưa được gắn nhãn để xử lý nhiều loại công việc khác nhau, từ dịch văn bản cho đến phân tích hình ảnh y khoa.

Sau khi xây dựng mô hình AI cho các trường hợp sử dụng PC, nhà đầu tư có thể tối ưu hóa chúng bằng thư viện NVIDIA TensorRT để tận dụng tối đa Tensor Cores (6) của card đồ họa RTX.
(6) Tensor Core: là một loại bộ xử lý chuyên dụng được thiết kế để tăng tốc các tác vụ học máy. Chúng có thể được sử dụng trong game để tăng cường đồ họa, cải thiện hiệu suất và mở ra các khả năng mới cho các nhà đầu tư game.

Tập đoàn NVIDIA đã mở rộng thư viện TensorRT sang các ứng dụng dựa trên văn bản với thư viện mã nguồn mở TensorRT-LLM dành cho hệ điều hành Windows để tăng tốc LLM. Bản cập nhật mới nhất cho TensorRT-LLM, hiện đã có, bổ sung Phi-2 vào danh sách ngày càng tăng các mẫu được tối ưu hóa trước cho PC, chạy nhanh hơn tới 5 lần so với các chương trình phụ trợ suy luận khác.

AI tạo sinh được RTX tăng tốc mang lại trải nghiệm mới với máy tính để bàn

Tại hội chợ Công nghệ CES, tập đoàn NVIDIA cùng các đối tác đã công bố các ứng dụng và dịch vụ thế hệ mới được hỗ trợ bởi AI tạo sinh cho PC, bao gồm:
– NVIDIA RTX Remix, một nền tảng dùng để tạo các bản remaster RTX tuyệt đẹp từ các trò chơi cổ điển. Đã phát hành bản beta vào cuối tháng 01/2024, nó cung cấp các công cụ AI tạo sinh có thể chuyển đổi kết cấu cơ bản từ trò chơi cổ điển thành vật liệu kết xuất dựa trên vật lý, độ phân giải 4K hiện đại.
– Các microservice của NVIDIA ACE, bao gồm các mô hình hoạt hình và được AI tạo sinh hỗ trợ giọng, cho phép các nhà đầu tư thêm hình đại diện kỹ thuật số thông minh, năng động vào trò chơi.
– Tăng tốc thư viện TensorRT cho các mô hình Stable Diffusion XL (SDXL) Turbo và Latent Consistency, hai trong số các phương pháp tăng tốc Stable Diffusion phổ biến nhất. Thư viện TensorRT cải thiện hiệu suất của cả hai lên tới 60% so với cách triển khai nhanh nhất trước đó. Hiện cũng đã có phiên bản cập nhật của Stable Diffusion WebUI TensorRT, bao gồm khả năng tăng tốc cho SDXL, SDXL Turbo, LCM – Low-Rank Adaptation (LoRA) và hỗ trợ LoRA được cải thiện.
– Công nghệ NVIDIA DLSS 3 với Frame Generation, sử dụng trí tuệ nhân tạo để tăng tốc độ khung hình lên gấp 4 lần so với kết xuất gốc, sẽ xuất hiện trong hàng chục trong số 14 trò chơi RTX đã được công bố, bao gồm Horizon Forbidden West, Pax Dei và Dragon’s Dogma 2.
– Chat with RTX, bản demo công nghệ NVIDIA ra mắt vào cuối tháng 01/2024, cho phép những khách hàng đam mê AI dễ dàng kết nối mô hình ngôn ngữ lớn LLM PC với dữ liệu của riêng họ bằng cách sử dụng một kỹ thuật phổ biến được gọi là thế hệ tăng cường truy xuất (RAG). Bản demo được thư viện mã nguồn mở TensorRT-LLM tăng tốc, cho phép người dùng tương tác nhanh chóng với ghi chú, tài liệu và nội dung khác của họ. Nó cũng sẽ có sẵn dưới dạng một dự án tham khảo nguồn mở, vì vậy các nhà đầu tư có thể dễ dàng triển khai các dự án tương tự trong các ứng dụng của riêng họ.

Để xem các tin bài khác về “AI tạo sinh”, hãy nhấn vào đây.

 

Nguồn: NVIDIA

Bình luận hay chia sẻ thông tin