Phân tích ý tưởng cho các sản phẩm AI trên Solana
Bài viết được thực hiện bởi bạn @trant2338 - Superteam Vietnam Member
Solana mới đây đã tuyên bố sẽ tăng tài trợ cho các khoản tài trợ cho các dự án tích hợp chuỗi khối Solana và trí tuệ nhân tạo lên 10 triệu đô la từ cam kết ban đầu là 1 triệu đô la. Các nhà phát triển cho biết chương trình tài trợ đã nhận được hơn 50 đơn đăng ký. Ngoài ra, Quỹ Solana đã khởi động chương trình tăng tốc kéo dài ba tháng dành cho sinh viên đại học nhằm thực hiện thử nghiệm với blockchain và AI. Chương trình đã nhận được hàng trăm đơn đăng ký từ các dự án và cộng tác viên, và đã phát triển nên một chatbot Solana U nhằm trả lời những câu hỏi của người dùng về hệ sinh thái Solana. Cùng trong hệ sinh thái, Hivemapper đã ra mắt AI Trainers vào tháng trước để chuyển đổi hình ảnh trong thế giới thực thành bản đồ kỹ thuật số chất lượng cao với các chi tiết bao gồm giới hạn tốc độ, biển cảnh báo và các thông tin liên quan đến đường phố khác. Kể từ đó, các nhà phát triển tuyên bố rằng các contributors đã thực hiện trên 5,7 triệu đánh giá đào tạo AI, với 500.000 đối tượng đạt được sự đồng thuận.
Bài viết sẽ tập chung phân tích các hướng đi chính của việc tích hợp AI vào blockchain hiện tại và khía cạnh công nghệ chung của những AI product này
ChatGPT plugin
Solana được xây dựng để mở rộng quy mô — một chuỗi khối có chi phí thấp, tốc độ cao, tác động năng lượng tối thiểu và trải nghiệm người dùng dễ dàng. Trí tuệ nhân tạo có thể giảm thiểu trở ngại đó và đồng thời mở ra khả năng phân cấp cho hàng triệu người bằng cách làm cho việc sử dụng trở nên dễ dàng hơn. Mới đây, Solana Foundation, tổ chức phi lợi nhuận chuyên duy trì và phát triển chuỗi khối Solana lớp 1, đã thông báo rằng họ đã tích hợp trí tuệ nhân tạo (AI) bằng cách sử dụng plugin ChatGPT do Solana Labs phát triển.
Plugin ChatGPT có sẵn dưới dạng bản tải xuống từ GitHub và đóng vai trò là tài liệu tham khảo về cách AI có thể giúp hiểu dữ liệu và giao thức Solana dễ dàng hơn hoặc dữ liệu bề mặt về cơ sở hạ tầng điện toán của Solana và các dự án DeFi.
Plugin cung cấp một loạt chức năng trong hệ sinh thái Solana, chẳng hạn như khả năng:
Mua NFT
Chuyển giao tokens
Kiểm tra giao dịch
Giải thích dữ liệu tài khoản công cộng
Tìm kiếm các bộ sưu tập NFT dựa trên giá sàn của chúng trên Solana
Các tính năng này dự kiến sẽ nâng cao trải nghiệm người dùng và cung cấp quyền truy cập thuận tiện vào các hoạt động liên quan đến chuỗi khối khác nhau trên mạng Solana.
Solana đang đặt ChatGPT vào một nút RPC sẽ đọc dữ liệu từ nhiều nguồn trên chuỗi và phổ biến thông tin đó cho những người dùng đang đặt câu hỏi. Ví dụ: người dùng có thể đặt câu hỏi cho AI về bộ sưu tập NFT, họ có thể mua NFT nào bằng mã thông báo SOL mà họ có trong tài khoản, v.v. nhằm nâng cao trải nghiệm người dùng trên dApp của Solana, bởi tích hợp ChatGPT cung cấp một cách mới để người dùng và nhà phát triển Solana đặt câu hỏi về dịch vụ AI, đồng thời làm cho trải nghiệm trở nên đơn giản hơn. Người đọc sẽ không còn phải đọc tài liệu 800 trang về dự án dựa trên Solana, AI làm điều đó cho bạn và sau đó có thể chia sẻ câu trả lời cho câu hỏi của mọi người.
AI Trainers phân tích hình ảnh của Hivemappers
Hivemapper đã ra mắt AI Trainers vào giữa tháng 4 năm 2023 để tăng tốc khả năng của AI trong việc chuyển đổi hình ảnh trong thế giới thực thành bản đồ kỹ thuật số chất lượng cao với các chi tiết cần thiết bao gồm giới hạn tốc độ, biển cảnh báo và các thông tin khác liên quan đến đường phố. Kể từ đó, những người đóng góp đã bắt đầu 5,7 triệu đánh giá đào tạo AI với 500.000 đối tượng đạt được sự đồng thuận (approval consensus). Không giống như các công ty Công nghệ lớn lấy dữ liệu người dùng miễn phí và không trả thù lao cho người chỉnh sửa bản đồ, mạng lưới Hivemapper thưởng cho builders bằng token $HONEY để thu thập hình ảnh ở cấp độ đường phố và làm mới nó. Ngoài ra, thiết bị thu thập Hivemapper Dashcam rẻ hơn 1000 lần so với ô tô Google Street View, và thiết bị này đang tiếp tục được cải tiến để nâng cao chất lượng hình ảnh. Tốc độ tăng trưởng hiện tại của Hivemapper nhanh hơn khoảng 8 lần so với 133.000 km mỗi tháng mà Google Street View đạt được trung bình trong 5 năm đầu tiên sau khi ra mắt Google Street View vào tháng 5 năm 2007. Builders của Hivemapper hiện đã thu thập được 2 triệu km đường phố duy nhất hình ảnh trên khắp thế giới, tăng từ 1 triệu km một tháng trước. Bản đồ AI của Hivemappers xử lý trình điều khiển hình ảnh thu thập bằng Hivemapper Dashcam và trích xuất dữ liệu bản đồ: giới hạn tốc độ, hạn chế rẽ, thông tin lối ra đường cao tốc, v.v. Với nguồn cung cấp hình ảnh mới liên tục và quy trình Map AI sáng tạo này, bản đồ Hivemapper đang đi đúng hướng để trở thành bản đồ chính xác và chi tiết nhất.
Theo tìm hiểu, hiện tại Hivemappers thường được cộng tác bởi nhiều tài xế Uber, hoặc tài xế giao đồ ăn Uber Eats và Doordash và tài xế lái xe chở hàng, giúp tăng lượng dữ liệu hình ảnh mà cộng đồng đóng góp cho dự án và tăng lượng hình ảnh có thể đưa cho AI để thực hiện việc học máy phân tích hình ảnh.
Map AI Trainers của Hivemappers:
Omni chatbot - MarginFi
Nhóm MarginFi đã giới thiệu bot trò chuyện Omni để trả lời các câu hỏi về Solana và các dự án dựa trên Solana, bao gồm Meteora, Jupiter, Tensor, Mango Markets, Zeta, Kamino, Lido, Orca, v.v.
Ngoài ra, thông qua Pyth Networks, Omni có thể cung cấp cho người dùng giá và tỷ lệ tiền điện tử theo thời gian thực và thậm chí có thể tham gia vào các hoạt động trên chuỗi theo yêu cầu của người dùng, và Omni có thể thay mặt người dùng rút tiền điện tử. Cách sử dụng của Omni chatbot khá tương tự với ChatGPT, người dùng input vào prompt dưới dạng văn bản sau đó Omni sẽ đưa ra câu trả lời hoặc hỗ trợ người dùng trong một số lệnh cơ bản mà bot đã được dạy sẵn. Bạn có thể dùng thử Omni ở đây:
https://omni.marginfi.com/
AI Generated Content (AI-generated NFT) hỗ trợ phát triển NFT
Find Satoshi Lab, nhà phát triển game Move-to-Earn STEPN và thị trường NFT MOOAR, vừa công bố ra mắt sản phẩm AI Generated Content (AIGC) trên blockchain Solana. Sản phẩm được đặt tên là Generative NFT Tool (GNT), nhằm cung cấp một hệ thống cho người sáng tạo để tạo và đúc NFT của riêng họ trên MOOAR.
Công cụ GNT nhằm mục đích giới thiệu thế hệ người sáng tạo tiếp theo với giao diện thân thiện người dùng, loại bỏ nhu cầu về kiến thức AI, kỹ thuật thành thạo hoặc triển khai hợp đồng thông minh. Phiên bản thử nghiệm alpha của GNT sẽ có sẵn trên MOOAR trong những ngày tới và được dùng thử miễn phí trong một khoảng thời gian giới hạn. GNT có các tính năng độc đáo như trình tạo lời nhắc nội bộ để giúp người sáng tạo viết lời nhắc tốt hơn, cũng như mô hình AI để biến những lời nhắc đó thành NFT kiểu PFP. Trong thời gian thử nghiệm, người dùng sẽ có thể tạo PFP kiểu sneaker. GNT cho phép tạo theo đợt lên tới 1.000 NFT, được tự động tải lên blockchain và bắt đầu bán công khai.
GNT có tác động rất lớn đối với ngành là vì nó sẽ hạ thấp rào cản gia nhập thị trường cho người tạo NFT, cho phép cả cá nhân và doanh nghiệp từ Web2 và Web3 phát hành bộ sưu tập của riêng họ cho mục đích cá nhân và thương mại. Vì vậy, tiềm năng sáng tạo của công cụ này là vô tận. GNT cũng sẽ tạo ra các tiện ích mới cho $GMT, bao gồm việc burn $GMT để tạo NFT, cũng như hệ thống cấp độ và lòng trung thành với phần thưởng cho việc giao dịch NFT. Hệ thống cấp độ và phần thưởng khuyến khích người dùng giao dịch NFT theo $GMT, tạo ra thanh khoản gắn liền $GMT với NFT trên MOOAR.
MOOAR là NFT Marketplace và Launchpad phụ thuộc vào các thành viên trên Solana và Ethereum. Nền tảng này nhằm mục đích giảm đáng kể rào cản gia nhập để tạo các bộ sưu tập NFT và hỗ trợ người sáng tạo ban đầu bán ra thị trường. Nền tảng này cũng tạo điều kiện để giao dịch NFT trở nên thu hút và bổ ích, với phần thưởng được phân phối theo cách thú vị trong một thời gian dài. MOOAR Launchpad khám phá các dự án NFT blue chip trong tương lai có các tiện ích tuyệt vời, không giới hạn ở PFP, thông qua quy trình bỏ phiếu của cộng đồng.
Tech Process
AI chatbot
Các bước tạo AI chatbot
Tạo đầu vào Chatbot AI bắt đầu hoạt động ngay khi người dùng nhập thông tin đầu vào, truy vấn hoặc câu hỏi mà họ muốn có câu trả lời. Chatbox thường được thu thập đầu vào dưới dạng văn bản, được lập trình sẵn với một số lượng phản hồi hạn chế.
Với chatbot như ChatGPT, ChatGPT có khả năng tạo phản hồi dựa trên ngữ cảnh và giọng điệu của cuộc trò chuyện. Điều này làm cho ChatGPT được cá nhân hóa và tinh vi hơn so với chatbot. Điều này có được bởi lượng văn bản đầu vào của ChatGPT ở khối lượng lớn hơn rất nhiều so với chatbox thông thường nhằm phục vụ quá trình Deep Learning của AI ở giai đoạn sau.
Phân tích đầu vào Khi chatbot AI nhận được đầu vào, quá trình sẽ bắt đầu. Giờ đây, hiểu ngôn ngữ tự nhiên (NLU), một tập hợp con của NLP, được áp dụng để phân tách văn bản thành các phân số nhằm rút ra ý nghĩa của thông tin đầu vào bằng cách phát hiện ý định, tình cảm và giọng điệu của cách nói tự nhiên.
Đơn vị NLU (Natural Language Unit) chịu trách nhiệm chuyển đổi lời nói hoặc văn bản của người dùng sang khung ngữ nghĩa được xác định trước theo quy ước của hệ thống, tức là sang định dạng mà hệ thống có thể hiểu được. Điều này bao gồm một nhiệm vụ điền vào chỗ trống và phát hiện ngữ cảnh của cuộc đối thoại. Ví dụ: ngữ cảnh (intention) sẽ được thể hiện thông qua là một lời chào, như Xin chào, có thể mang tính chất thông báo, ví dụ: tôi thích học tin học, nơi người dùng đang cung cấp một số thông tin bổ sung. Tùy thuộc vào sở thích, các vị trí (slots) có thể rất đa dạng, chẳng hạn như tên diễn viên, giá, thời gian bắt đầu, thành phố đích, v.v. Ý định (intention) và vị trí (slot) xác định bản chất miền đóng (closed-domain) của Chatbot. Nhiệm vụ lấp đầy chỗ trống và phát hiện ý định được coi là một vấn đề gắn thẻ trình tự (sequential tagging/ labelling), tức là những phần trong một câu sẽ được gắn trình tự để AI có thể hiểu được văn bản dựa trên cấu trúc câu thường có. Bằng công cụ phân tích ngôn ngữ này, AI chatbox thực hiện quá trình học máy nhằm khớp mục đích của thông tin đầu vào với cơ sở dữ liệu để tìm nạp thông tin liên quan.
Tạo đầu ra Giờ đây, khi chatbot AI biết ý nghĩa của người dùng, nó sẽ hoạt động để trình bày cho họ câu trả lời phù hợp, tốt nhất có thể phù hợp với truy vấn. Với sự trợ giúp của việc tạo ngôn ngữ tự nhiên (NLG), chatbot tạo ra phản hồi bằng văn bản, sau đó được truyền đạt tới người dùng. Natural Language Generation (NLG) là quá trình tạo văn bản từ việc hiểu ý nghĩa của câu nói. Các hệ thống NLG đóng vai trò quan trọng đối với hệ thống tóm tắt văn bản, dịch máy và đối thoại. Trong NLG, phản hồi của hệ thống dưới dạng khung ngữ nghĩa output trở lại một câu ngôn ngữ tự nhiên để người dùng cuối có thể hiểu được. NLG dựa trên quy tắc đưa ra một số câu mẫu được xác định trước cho một khung ngữ nghĩa nhất định, do đó chúng rất hạn chế mà không có bất kỳ khả năng khái quát hóa nào. Các hệ thống NLG sử dụng một số nguồn làm đầu vào, chẳng hạn như: kế hoạch nội dung, ý nghĩa hoặc nội dung giao tiếp với người dùng, cơ sở tri thức, cơ sở dữ liệu có cấu trúc để trả về cho miền, hộp thoại lịch sử, thông tin từ các lượt trước để tránh lặp lại.
Học tăng cường Theo thời gian và sau hàng trăm nghìn lượt tương tác, chatbot AI sẽ thu thập được một núi dữ liệu có cấu trúc. Mỗi tương tác chatbot là thành công hoặc thất bại với người dùng. Dựa trên trải nghiệm người dùng này, chatbot AI sẽ học lại và tinh chỉnh các phản hồi của nó vào lần tiếp theo. Thông tin này giúp chatbot tích trữ nhiều ý định và cách nói để làm cơ sở cho việc học hỏi tiếp tục nhằm khiến cho cuộc đối thoại trở nên tự nhiên và có ngữ điệu hơn.
AI chạy dữ liệu dưới dạng hình ảnh (phân tích/label hình ảnh) hoặc tạo hình ảnh mới từ prompt
Điểm chung của AI dạng images generator (như dự án số 4) với một số dự án AI khác như Midjourney.AI, Dall-E đó là đều sử dụng mô hình NLP (Natural Language Processing) để AI có thể xử lý yêu cầu người dùng dưới dạng văn bản (prompt).
Để AI có thể xử lý thông tin dưới dạng hình ảnh, AI cần được trang bị thị giác máy tính (computer vision). Lĩnh vực AI này liên quan đến khả năng máy tính hiểu và giải thích thông tin hình ảnh, chẳng hạn như hình ảnh và video. Thị giác máy tính được sử dụng trong nhiều ứng dụng, bao gồm ô tô tự lái, hệ thống giám sát và hình ảnh y tế. Với các mô hình và thuật toán thị giác máy tính tiên tiến, AI có thể xác định và phân loại chính xác các đối tượng, con người và các yếu tố khác trong hình ảnh và video. Để làm được điều này, AI sẽ được feed lượng hình ảnh được label/tag từng yếu tố trong hình ảnh để phân biệt được đối tượng mà nó đang thấy. Khi xử lý input (dưới dạng ảnh), AI sẽ nhận diện và xử lý hình ảnh qua các bước cơ bản như xoay và crop ảnh, thay đổi (convert) định dạng ảnh. Sau đó AI sẽ phát hiện và xác định các đối tượng trong ảnh. Ngoài NLP và thị giác máy tính, AI phân tích hình ảnh cũng được tăng cường bằng Deep Learning and Enhanced/ Reinforcement Learning. Với Deep Learning, AI sẽ được đào tạo các mạng lưới thần kinh nhân tạo để thực hiện các nhiệm vụ như nhận dạng hình ảnh và xử lý ngôn ngữ tự nhiên. Học tăng cường là một loại máy học trong đó một tác nhân (agent) học cách đưa ra quyết định bằng cách tương tác với môi trường của nó và nhận phản hồi dưới dạng rewards hoặc penalty.
Đối với dự án Hivemapper, bên cạnh mô hình phi tập trung hiệu quả trong việc sử dụng crypto networks trong việc trả thưởng cho các contributors, một điểm hay khác của mạng Hivemapper là việc sử dụng AI để trích xuất các đối tượng (biển báo giới hạn tốc độ, đèn giao thông, v.v.) từ hình ảnh và định vị chính xác chúng trên thế giới. Các khách hàng tiềm năng về dữ liệu bản đồ đã chú ý đến tốc độ thu thập nhanh chóng của Hivemapper và giờ họ cũng muốn xác thực chất lượng và độ chính xác của các đối tượng được trích xuất. Nhiệm vụ của AI trong dự án cũng tương tự như các dự án sử dụng AI để xử lý hình ảnh. Trong tương lai khi lượng hình ảnh được feedforward vào neural networks càng lớn, khả năng learning của Hivemapper AI sẽ càng phát triển và trở nên hiệu quả hơn.