Tải dữ liệu cho máy học

Dear All.

Nhằm tạo dữ liệu phục vụ cho việc nghiên cứu máy học phục vụ các bài giảng cho Sinh Viên và Cộng Đồng, Tui có build 1 Website thương mại điện tử http://ecom.uelstore.com/

Website này hoạt động từ năm 2018, hiện nay đã nhờ các tình nguyện viên tương tác để tạo ma trận cộng tác trên hệ thống nhằm phục vụ cho các nghiên cứu máy học.

Dữ liệu hiện có (tính từ tháng 01/2018 tới 03/2022):

  • 678 user
  • 732 sản phẩm các loại (Tui sẽ cập nhật hơn 1000 sản phẩm)
  • 130754 đánh giá sản phẩm

Dữ liệu này sẽ là nguồn cho Sinh viên và mọi người sau này muốn sử dụng để làm dataset cho các bài toán về máy học, khai phá dữ liệu… Sau này Tui sẽ viết service để publish dữ liệu ra theo cấu trúc JSON cho các tình nguyện viên thông qua email mà họ đăng ký trên hệ thống (khi có bất kỳ tình nguyện viên yêu cầu, dữ liệu sẽ được gửi tới tình nguyện viên đó).

Bộ dữ liệu này có thể được dùng để nghiên cứu các bài toán như:

  • Phân tích cảm xúc của khách hàng
  • Tạo hệ thống khuyến nghị dựa trên lọc nội dung, dựa trên lọc cộng tác ma trận
  • Dự báo các giao dịch bất thường
  • Dự báo doanh thu

Để được gửi Dataset, Các tình nguyện viên cần tạo 1 tài khoản bằng email của mình, rồi Comment + rating từ 10 tới 30 sản phẩm bất kỳ. Tương ứng với rating các tình nguyện viên sẽ comment bằng English để sau này có thể dùng cho các bài báo công bố quốc tế.

Thank All

Leave a Reply