Thêm sản phẩm đánh dấu khả năng làm chủ công nghệ của Việt Nam

© Ảnh : VinBigdataGiao diện ViGPT lúc ra mắt
Giao diện ViGPT lúc ra mắt - Sputnik Việt Nam, 1920, 28.12.2023
Đăng ký
HÀ NỘI (Sputnik) – Việc ra mắt những ứng dụng riêng người Việt là tín hiệu tốt, cho thấy những nỗ lực của các đơn vị công nghệ trong nước. Từ đó từng bước giảm sự phụ thuộc vào sản phẩm quốc tế và nâng cao tính chính xác của thông tin chứa giá trị lịch sử, văn hoá Việt.

Xóa bỏ sự phụ thuộc vào sản phẩm quốc tế

Năm 2023, “cú nổ” ChatGPT của Open AI đã làm rung chuyển thị trường công nghệ thế giới, mở ra cuộc đua chinh phục AI tạo sinh giữa các các quốc gia và ông lớn trong lĩnh vực công nghệ.
Có thể thấy, các nguồn dữ liệu tiếng Anh thường tạo ra các mô hình ngôn ngữ lớn nhất trên thế giới. Do đó, mô hình không thực sự hiểu và phản ứng tốt với văn hóa và ngữ cảnh của người Việt. Điều này khiến mô hình ngôn ngữ này "bịa đặt" ra câu trả lời không chính xác. Điều này đặt ra thách thức lớn đối với các đơn vị nghiên cứu công nghệ AI tại Việt Nam.
Và thực tế đang chứng minh rằng, Việt Nam cũng không nằm ngoài xu hướng này với hàng loạt các sản phẩm AI tạo sinh ra đời. Gần đây, một số đơn vị nghiên cứu công nghệ GenAI liên tục cho ra mắt các mô hình, có thể kể đến như FPT Gen AI, PhởGPT hay Zalo AI LLM.
Đáng chú ý, mới đây nhất ngày 27/12/2023 tại TP.HCM, VinBigdata (Tập đoàn Vingroup) chính thức công bố sự ra mắt của ứng dụng ViGPT - ứng dụng tương tự chatGPT của riêng người Việt. Việc làm chủ công nghệ và tự phát triển, ứng dụng đầu tiên dành cho người dùng cuối được xem là bước tiến giúp đơn vị này đưa công nghệ AI tạo sinh vào hệ sinh thái các sản phẩm, dịch vụ trên thị trường.
Có thể thấy, dù Việt Nam đang ở những bước đầu trên hành trình chinh phục AI tạo sinh, nhưng việc ra mắt những ứng dụng riêng người Việt là tín hiệu tốt cho thấy những nỗ lực của các đơn vị công nghệ trong nước. Chia sẻ với Sputnik về sự ý nghĩa của việc ra đời ứng dụng, GS. Vũ Hà Văn, Giám đốc Khoa học VinBigdata cho biết:
© Ảnh : VinBigdataGS. Vũ Hà Văn (Giám đốc Khoa học VinBigdata)
GS. Vũ Hà Văn (Giám đốc Khoa học VinBigdata)  - Sputnik Việt Nam, 1920, 28.12.2023
GS. Vũ Hà Văn (Giám đốc Khoa học VinBigdata)

“Việc ra mắt một “ChatGPT phiên bản Việt" đánh dấu khả năng làm chủ công nghệ của Việt Nam. Cao hơn thế nữa, qua việc làm chủ công nghệ, chúng ta có thể tự chủ khai thác, bảo vệ an ninh dữ liệu quốc gia, cùng hệ tri thức, tư tưởng mang bản sắc Việt Nam. Hướng đi này sẽ cho phép chúng ta không chỉ xoá bỏ sự phụ thuộc vào những sản phẩm quốc tế, mà còn có thể dần dần nâng cao tính chính xác của thông tin chứa giá trị lịch sử, văn hoá Việt và giảm thiểu dòng chảy dữ liệu ra nước ngoài”.

Đặc biệt, xét về độ đảm bảo thông thông tin chính xác, ứng dụng do người Việt Nam làm chủ sẽ có tính ưu Việt hơn, nhằm tránh đưa sai lệch thông tin về lịch sử, văn hóa, chính trị của Việt Nam.
“Ví dụ bây giờ có một câu hỏi trong giai đoạn chính trị nhạy cảm về lịch sử, chúng ta có gì đảm bảo để cho những câu trả lời của Google và OpenAI không mang xu hướng chính trị của những người thành lập ra công ty đó, hoặc những người đứng đằng sau công ty đó. Ở đây, chúng ta có những sự lựa chọn khác ở Việt Nam, tôi nghĩ đó là một điều tốt hơn”, ông Văn nói.
ChatGPT  - Sputnik Việt Nam, 1920, 30.04.2023
ChatGPT có khả năng còn nguy hiểm hơn cả vũ khí hạt nhân
Điều này cũng hoàn toàn phù hợp với định hướng của Chính phủ Việt Nam khi mới đây, Bộ Thông tin & Truyền thông ban hành kế hoạch, đặt mục tiêu đến năm 2025, Việt Nam có ít nhất một nền tảng công nghệ LLM tiếng Việt.
Kế hoạch nhấn mạnh việc nghiên cứu, phát triển, đưa vào ứng dụng LLM tiếng Việt là một nhiệm vụ quan trọng, cần thiết và ý nghĩa. LLM tiếng Việt sử dụng tri thức, dữ liệu đào tạo đã được sàng lọc của Việt Nam, với chi phí thấp cho người dân, doanh nghiệp, tổ chức tại Việt Nam sử dụng để phát triển các ứng dụng mới.

Điểm khác biệt

Đến hiện tại ViGPT có khả năng cung cấp thông tin chính xác hơn liên quan đến các lĩnh vực đặc thù hay thông tin mang tính bản địa đặc trưng của Việt Nam. Ví dụ như câu hỏi về lịch sử, văn hoá lịch sử (“Ý nghĩa của Dinh Độc Lập?", “Nhà Lý có mấy đời vua?”, “Nguồn gốc của lễ hội đền Gióng?”); hay những thắc mắc về Pháp luật (“Quốc hội được thực hiện những quyền gì theo quy định của Hiến pháp năm 2013?”,“Tuổi của học sinh vào lớp 1 là bao nhiêu?”); hoặc về lĩnh vực Sức khỏe (“Bị bệnh tiểu đường nên ăn gì?”, “Tóc rụng có bình thường?”). Chất lượng về mặt thông tin, về mặt tri thức sẽ đồng nhất và phù hợp với các nguồn chính thống của Việt Nam.
Vậy giữa ViGPT khác gì so với những mô hình tương tự đã ra đời trước đó? Với những mô hình từ nước ngoài như ChatGPT của Open AI thì tiếng Việt được coi là ngôn ngữ “low-resource”, tức là không phải trọng tâm của sản phẩm. Trong khi, ViGPT lại tập trung vào ngôn ngữ tiếng Việt. Đặc biệt, ViGPT còn có thể tương tác và trả lời người dùng bằng giọng nói.
Trẻ em châu Á học trực tuyến - Sputnik Việt Nam, 1920, 14.02.2023
Thứ trưởng Bộ Giáo dục Việt Nam khuyến khích trải nghiệm ChatGPT
Thông tin thêm tới Sputnik, đại diện VinBigdata cho hay, đối tượng mà ViGPT hướng đến là phục vụ cho cá nhân, cộng đồng khoa học và cả doanh nghiệp. Trong khi, đối tượng của ChatGPT (Open AI) chỉ dành cho người dùng cuối, hay FPT GenAI chỉ phục vụ cho doanh nghiệp. Còn riêng PhởGPT thiết kế theo mô hình mã nguồn mở, phục vụ cho cộng đồng các nhà phát triển phần mềm.

“ViGPT sẽ tập trung vào đặc trưng, văn hóa lịch sử của người Việt. Đó là những lĩnh vực cần phải phát triển và cần phải lưu giữ cho những thế hệ sau. Đặc biệt phiên bản của ChatGPT có thể chưa thực sự đưa ra những cái câu trả lời, hoặc là đưa ra những cái nội dung mà nó sát với thực tế về lịch sử và văn hóa đặc trưng vùng miền của Việt Nam. Với ViGPT đây là thế mạnh. Còn đối với PhởGPT là đưa ra một bản công nghệ lõi và ViGPT thì chúng tôi đưa ra một phiên bản tới tận người dùng cuối. Đấy là sự khác nhau”, TS. Nguyễn Kim Anh – Giám đốc sản phẩm VinBigdata cho hay.

© Ảnh : VinBigdataTS. Nguyễn Kim Anh (Giám đốc Sản phẩm VinBigdata) trong buổi ra mắt ViGPT
TS. Nguyễn Kim Anh (Giám đốc Sản phẩm VinBigdata) trong buổi ra mắt ViGPT - Sputnik Việt Nam, 1920, 28.12.2023
TS. Nguyễn Kim Anh (Giám đốc Sản phẩm VinBigdata) trong buổi ra mắt ViGPT
So với “người anh cùng họ Vingroup”, về đặc điểm Phở GPT sở hữu 1GB văn bản Wikipedia và một biến thể 40GB đã loại bỏ các phần trùng lặp từ tập dữ liệu tin tức. Trong khi, ViGPT sở hữu cho mình hơn 600GB dữ liệu tiếng Việt, được huấn luyện bằng kiến trúc tự cải tiến khác với phần lớn các mô hình ngôn ngữ lớn hiện tại với kích thước mô hình tối ưu chỉ khoảng 1,6 tỷ tham số.
Tuy nhiên, Giám đốc Khoa học VinBigdata GS. Vũ Hà Văn cho biết thêm, ViGPT đang ở giai đoạn bắt đầu và giống như các ứng dụng đã ra mắt trước đó như ChatGPT (OpenAI) hay Bard (Google). Các sản phẩm ban đầu đều có lỗi sai và thuật toán, có thể rơi vào tình trạng đưa ra thông tin không chuẩn xác. Do đó, VinBigdata muốn tận dụng quá trình dùng thử để thu thập ý kiến, góp ý, phản hồi từ cộng đồng người dùng để tiếp tục hoàn thiện công cụ này, giúp phục vụ tốt cho người Việt.
Trí tuệ nhân tạo (AI) - Sputnik Việt Nam, 1920, 27.12.2023
Ý kiến chuyên gia: AI sẽ thay đổi hoàn toàn nền kinh tế toàn cầu
Trong tương lai, VinBigdata có thể sẽ hướng tới những đơn vị phi lợi nhuận. Ví dụ, một trường học muốn dùng thử công cụ này, VinBigdata sẵn sàng chia sẻ cho trường học, học sinh và phụ huynh trong tra cứu và dùng thử. Từ những phản hồi đó, doanh nghiệp có thể đem lại những cái trải nghiệm tốt hơn hoặc là thông tin chính xác hơn.

Giá thành tối ưu hóa

Như đã nói ở trên, ViGPT sẽ chia làm 3 phiên bản. Trong đó, sẽ tập trung vào phiên bản cộng đồng và doanh nghiệp.
Đối với bản cho cộng đồng sẽ thiên về những cái câu hỏi, tức là giải quyết những cái vấn đề liên quan đến lịch sử, văn hóa, những cái địa lý của người Việt, kiến thức cho dành cho người Việt.
Đối với bản cho doanh nghiệp sẽ tùy biến theo từng doanh nghiệp. Hay nói cách khác, mô hình công nghệ này có thể “may đo” cho từng doanh nghiệp. Ví dụ, ngành ngân hàng, thậm chí các ngân hàng khác nhau sẽ có những cái kho dữ liệu khác nhau. Hay đối với doanh nghiệp vận tải, sẽ có bản riêng cho taxi hoặc có thể có bản riêng cho một công ty sản xuất và bán xe như VinFast,...
Công ty con của Vingroup cho biết, họ sẽ tập trung vào việc tối ưu về chi phí cho doanh nghiệp trong quá trình vận hành.
“Chúng tôi đã đã xây dựng những cái mô hình cho bản doanh nghiệp mà nó có thể tối ưu xuống thấp hơn rất là nhiều với cả vài trăm lần so với cái cái giá mà ChatGPT (OpenAI) vận hành. Đấy là một điểm khác biệt”, Giám đốc sản phẩm VinBigdata nêu rõ.
Tin thời sự
0
Để tham gia thảo luận
hãy kích hoạt hoặc đăng ký
loader
Phòng chat
Заголовок открываемого материала