Khi trí tuệ nhân tạo và các ứng dụng hỗ trợ AI tăng trưởng theo từng năm, quyền riêng tư trên Internet ngày càng trở nên quan trọng. Nhưng bằng cách tích hợp với công nghệ bảo mật như Anyone Network – một hệ thống định tuyến hành tây (onion routing) phi tập trung – người dùng có thể xây dựng các ứng dụng AI một cách an toàn và ẩn danh.
Trong bài viết blog khách này của đội ngũ Anyone Protocol, chúng ta đi sâu vào cách một đơn vị điện toán đám mây GPU phi tập trung của Aethir có thể được thiết lập để cung cấp nội dung ẩn danh, đồng thời đánh giá hiệu năng so với các nhà cung cấp GPU hiện có.
Chúng ta bắt đầu.
Tóm tắt điều hành
Hợp tác
Anyone hợp tác với Aethir để đánh giá hạ tầng đám mây GPU dành cho AI, tập trung vào hiệu năng GPU và khả năng mở rộng. Phạm vi đánh giá kỹ thuật này tập trung vào việc đo lường hiệu năng GPU trong các tác vụ AI, đồng thời xây dựng một bot tiện ích chạy bằng AI thực tế được triển khai trên nền tảng Telegram.
Trước khi trình bày kết quả, nhóm tiến hành so sánh giữa nhu cầu hạ tầng của một doanh nghiệp nhỏ và vừa (SMB) với khả năng mà một đơn vị điện toán GPU trên đám mây của Aethir cung cấp. Điều này giúp đặt bối cảnh đánh giá về hiệu quả chi phí, khả năng mở rộng và hiệu suất trong các ứng dụng AI thực tế.
Kiến trúc
Thông số máy chủ đám mây
Mô hình GPU: RTX 5090 x 2
CPU: AMD Ryzen 9 7900X – 12 nhân
RAM: 64GB
Lưu trữ: 2TB
Mạng: 10Gbps
Công suất GPU: 575W
Hệ điều hành: Ubuntu 22.04.1-Ubuntu
Thông số máy chủ đặt tại chỗ
Mô hình GPU: RTX 4090
CPU: Intel Core i9-13900KS (thế hệ 13)
RAM: 64GB
Lưu trữ: 2TB
Mạng: 1Gbps
Công suất GPU: 450W
Hệ điều hành: Kernel 6.17.2-arch1-1
Kiến trúc phần mềm
Cả hai máy chủ đám mây và máy chủ đặt tại chỗ đều sử dụng cùng một cấu hình phần mềm, khác biệt chính là GPU. Kiến trúc thử nghiệm được xác định như sau:
Giao diện người dùng: Bot Telegram
Hệ thống xử lý: python-telegram-bot tích hợp với ComfyUI
Cơ sở dữ liệu: PostgreSQL (quản lý trạng thái và phiên người dùng)
Quy trình vận hành hệ thống
Người dùng tương tác thông qua Telegram, nơi bot đóng vai trò giao diện lệnh. Mỗi yêu cầu được bot phân tích và chuyển thành tác vụ cho ComfyUI, hệ thống sẽ thực hiện suy luận trên GPU.
Quy trình hoạt động:
Người dùng gửi lệnh qua Telegram
Bot Telegram nhận và phân tích lệnh
Bot gửi yêu cầu đến ComfyUI để xử lý
ComfyUI chạy mô hình và trả về kết quả (ví dụ: hình ảnh)
Bot gửi kết quả lại cho người dùng trên Telegram
PostgreSQL quản lý phiên, hàng đợi tác vụ và ánh xạ giữa lệnh và quy trình xử lý
Cấu trúc này giúp thực hiện suy luận không trạng thái nhưng vẫn lưu ngữ cảnh trong cơ sở dữ liệu, hỗ trợ mở rộng cho cả người dùng đơn và nhiều người dùng cùng lúc.
Ví dụ bot
Một lệnh như “/f” sẽ gửi yêu cầu chuyển văn bản thành hình ảnh đến ComfyUI. Bot xử lý yêu cầu, chờ tạo hình ảnh và gửi trả lại người dùng ngay trên Telegram.
Sau khi tạo hình (ví dụ: nhà du hành vũ trụ, áo thun), người dùng có thể tiếp tục chỉnh sửa bằng các lệnh khác như “/qwen” để yêu cầu thay đổi hình ảnh dựa trên mô tả. Quy trình chỉnh sửa này sử dụng mô hình Qwen và trả về hình ảnh mới sau khi áp dụng thay đổi. Việc kết chuỗi lệnh giúp hỗ trợ tạo hình nhiều bước ngay trong giao diện chat đơn giản.
Các điểm cuối (Endpoints)
Tất cả điểm cuối của ComfyUI được cung cấp thông qua API và tài liệu hướng dẫn chính thức tại máy chủ.
Một số điểm cuối quan trọng:
ws: Giao tiếp thời gian thực qua websocket
upload/image – post: tải ảnh lên
prompt – get: lấy trạng thái hàng đợi
prompt – post: gửi yêu cầu vào hàng đợi
queue – get: lấy trạng thái hàng đợi
queue – post: xử lý và quản lý hàng chờ
Những điểm cuối này được truy cập bằng mã trong hệ thống, giúp Telegram bot vận hành mượt mà mà không yêu cầu người dùng tương tác trực tiếp với API.
Quyền riêng tư
Để bảo vệ dữ liệu người dùng, đảm bảo truyền tải an toàn và bảo mật thông tin, các điểm cuối ComfyUI được định tuyến qua Anyone Network. Điều này được thực hiện bằng bộ phát triển Python SDK của Anyone Protocol.
SDK này cho phép “bọc” các yêu cầu API của ComfyUI trong các kết nối an toàn và ẩn danh, đảm bảo dữ liệu và hình ảnh đầu ra không bị truy cập trái phép.
SDK của Anyone cũng hỗ trợ dịch vụ ẩn (Hidden Service). Đây là các điểm máy chủ riêng tư có thể hoạt động mà không tiết lộ vị trí, danh tính hay địa chỉ IP. Điều này đặc biệt hữu ích cho:
– Xử lý dữ liệu nhạy cảm
– Mạng kháng kiểm duyệt
– Hạ tầng điện toán yêu cầu tính bí mật
Một ví dụ dịch vụ ẩn:
http://5ugakqk324gbzcsgql2opx67n5jisaqkc2mbglrodqprak5qz53mibyd.anon
Các dịch vụ ẩn có thể thiết lập cho cả front-end web hoặc các điểm cuối ComfyUI, bảo vệ toàn bộ quy trình.
Đánh giá hiệu năng (Benchmark)
Các đánh giá dưới đây so sánh RTX 4090 và RTX 5090 khi chạy cùng các mẫu quy trình trong ComfyUI.
Stable Diffusion 3
Mẫu dùng: sd3.5_simple_example
4090: 8.96 giây
5090: 5.96 giây
Tăng tốc: 33.48%
RTX 5090 nhanh hơn khoảng 33% trong tác vụ Stable Diffusion 3.5.
FLUX-SCHNELL
Mẫu dùng: flux_schnell_full_text_to_image
4090: 4.92 giây
5090: 1.80 giây
Tăng tốc: 63.41%
RTX 5090 nhanh hơn khoảng 63% trong thử nghiệm này.
FLUX-DEV
Mẫu dùng: tùy chỉnh
4090: 16.05 giây
5090: 10.11 giây
Tăng tốc: 37.01%
WAN 2.2
Mẫu dùng: video_wan2_2_14B_t2v
4090: 61.87 giây
5090: 37.15 giây
Tăng tốc: 39.94%
QWEN
Mẫu dùng: image_qwen_image_edit_2509
4090: 9.62 giây
5090: 4.44 giây
Tăng tốc: 53.83%
Hỗ trợ đa GPU
Vì máy chủ có hai GPU, có thể phân phối tác vụ cho từng thiết bị CUDA khác nhau. Kho lưu trữ bên dưới cung cấp ví dụ cấu hình đa GPU cho ComfyUI:
https:github.com/pollockjj/ComfyUI-MultiGPU
Giới thiệu ngắn về Anyone Protocol
Anyone là hạ tầng bảo mật toàn cầu phi tập trung. Bằng cách tích hợp với mạng định tuyến hành tây của họ, ứng dụng có thể đảm bảo quyền riêng tư và bảo mật lưu lượng mà không thay đổi trải nghiệm người dùng. Mạng được vận hành bởi hàng nghìn nút đóng góp băng thông để nhận thưởng token.
https:www.anyone.io
.jpg)




