Dựa trên video hướng dẫn của Tác giả
Bạn đang mất quá nhiều thời gian để phân tích dữ liệu bán hàng bằng các hàm Excel hoặc Google Sheets phức tạp? Mình hiểu rõ nỗi đau đó!
Trong bài viết này, mình sẽ hướng dẫn bạn cách kết hợp Google Sheets với N8N để tạo ra một AI agent có thể tự động phân tích dữ liệu và trả lời các câu hỏi về kết quả kinh doanh của bạn – một cách nhanh chóng và hiệu quả hơn hẳn các cách truyền thống.
Nội Dung Chính
Giới Thiệu & Chuẩn Bị Dataset
Trong video này, mình sẽ giới thiệu cách kết hợp Google Sheets với công cụ automation N8N để xây dựng một AI agent. Agent này có thể tự động phân tích chỉ số kinh doanh trong bảng tính và phản hồi cực nhanh – thay vì bạn phải mất thời gian với các hàm SUMIF hoặc PivotTable phức tạp.
Điểm Chính:
- Kết hợp Google Sheets + N8N + AI để phân tích dữ liệu tự động
- Không cần viết công thức phức tạp, tiết kiệm thời gian đáng kể
- Có thể tạo báo cáo nhanh chóng để gây ấn tượng với sếp và đồng nghiệp
Đầu tiên, mình cần chuẩn bị một dataset mẫu để demo. Trong video này, mình sử dụng trang Kaggle.com để tìm dataset. Đây là một nền tảng tuyệt vời nếu bạn đang học data analysis hoặc cần dữ liệu mẫu cho portfolio của mình.
Để tìm dataset phù hợp, mình vào mục dataset, lọc theo định dạng CSV (để dễ import vào Google Sheets), và chọn một dataset về doanh số bán hàng chocolate. Dataset này chứa các thông tin về doanh số bán hàng, có thể dùng để phân tích hành vi mua hàng và dự báo xu hướng thị trường.
Ý Kiến Của Mình:
Việc chọn dataset phù hợp rất quan trọng khi bạn đang học data analysis. Kaggle có hàng nghìn dataset miễn phí về đủ chủ đề, từ doanh số bán hàng đến dữ liệu y tế hay môi trường. Nếu bạn đang làm portfolio để xin việc, đây là nguồn tài nguyên tuyệt vời nhé!
Cài Đặt Google Sheet & Làm Sạch Dữ Liệu
Sau khi tải dataset về, bước tiếp theo là import vào Google Sheets. Quá trình này khá đơn giản: mở Google Sheets, vào File > Import > Upload, chọn file CSV vừa tải, và chọn “Insert new sheet” để import dữ liệu.
Chỉnh Sửa Cấu Trúc Bảng:
- Đổi tên cột để tránh khoảng trắng (chuẩn bị cho SQL)
- Format lại các cột số thành định dạng “Number” (bỏ dấu $ nếu có)
- Đảm bảo tên cột viết thường và nhất quán
Một tip hay mình muốn chia sẻ: khi làm việc với SQL, tránh đặt tên cột có khoảng trắng sẽ giảm tỉ lệ sai sót khi viết truy vấn. Thay vì “Sale Person”, hãy đổi thành “saleperson” – điều này giúp quá trình truy vấn sau này đỡ lỗi hơn rất nhiều.
Ý Kiến Của Mình:
Làm sạch dữ liệu là bước quan trọng nhất trong data analysis, chiếm tới 80% thời gian của một data analyst chuyên nghiệp. Tuy nhiên, với những tip nhỏ như chuẩn hóa tên cột, định dạng số liệu từ đầu, bạn sẽ tiết kiệm được rất nhiều thời gian sau này đấy!
Cài Đặt BigQuery & Upload Dữ Liệu
Bước tiếp theo, mình sẽ đưa dữ liệu từ Google Sheets lên BigQuery – nền tảng lưu trữ dữ liệu đám mây của Google. Đây là bước quan trọng để kết nối với N8N sau này.
Các Bước Chính:
- Vào Google Cloud Console và tạo project mới
- Truy cập BigQuery Studio từ menu chính
- Tạo dataset mới (lưu ý đặt tên chỉ gồm chữ, số và dấu gạch dưới)
- Chọn region là Singapore để tốc độ truy vấn nhanh hơn
- Tạo table mới và import dữ liệu từ Google Drive
Khi tạo bảng mới, mình paste link Google Sheet vào, đặt tên bảng (ví dụ: “sales_chocolate”), và chọn “Auto detect” để BigQuery tự nhận diện cấu trúc. Trong phần cài đặt nâng cao, nhớ điền số “1” vào ô “Header rows to skip” để BigQuery hiểu rằng dòng đầu tiên là tên cột.
-- Câu lệnh SQL đơn giản để kiểm tra dữ liệu
SELECT * FROM `project_name.dataset_name.sales_chocolate` LIMIT 10;
Lưu Ý Quan Trọng:
Nếu bảng tính của bạn có các dòng gộp hoặc cấu trúc phức tạp (như tiêu đề phụ, subtotal,…), hãy làm sạch chúng trước khi import vào BigQuery. BigQuery yêu cầu cấu trúc bảng chuẩn với các hàng và cột rõ ràng. Nếu bạn cần hướng dẫn thêm về cách làm sạch dữ liệu Google Sheets, hãy để lại comment bên dưới nhé!
Xây Dựng AI Agent Với N8N
Phần thú vị nhất đã đến! Giờ mình sẽ xây dựng AI agent bằng N8N – một công cụ automation rất mạnh mẽ. Agent này sẽ kết nối với BigQuery, hiểu yêu cầu của người dùng qua chat, và tự động viết SQL để trả về kết quả phân tích.
Cài Đặt N8N:
- Tạo workflow mới trong N8N
- Thiết lập bộ nhớ ngắn hạn (10 messages)
- Chọn model AI (GPT-4 mini hoặc Gemini Pro Flash)
- Thêm công cụ BigQuery và Calculator
- Cấu hình credentials cho BigQuery
Để thêm công cụ BigQuery, mình cần credential từ Google Cloud. Các bạn cần enable BigQuery API, tạo credential mới (chọn “Web Application”), và cấp quyền cho N8N truy cập vào project của bạn.
Phần quan trọng nhất là thiết lập system prompt – hướng dẫn chi tiết để AI hiểu vai trò và nhiệm vụ của nó:
Bạn là một chuyên gia về phân tích dữ liệu. Đặc biệt bạn hiểu về cấu trúc SQL.
Nhiệm vụ của bạn:
1. Chào người dùng và giới thiệu bản thân
2. Tiếp nhận thông tin yêu cầu của người dùng để phân tích
3. Nếu thông tin chưa đầy đủ, hỏi thêm người dùng
4. Nếu thông tin đầy đủ, sử dụng công cụ BigQuery để viết truy vấn SQL phù hợp
Danh sách các cột trong bảng:
- salesperson: người bán hàng
- country: quốc gia
- year: năm
- month: tháng
- product: sản phẩm
- units: số lượng đơn vị
- amount: doanh số (USD)
- customers: số lượng khách hàng
Table ID: project_name.dataset_name.sales_chocolate
Ý Kiến Của Mình:
Phần system prompt rất quan trọng để AI có thể hoạt động đúng như mong đợi. Mình đề xuất nên cung cấp cả schema chi tiết của bảng dữ liệu và chỉ rõ table ID để AI có thể viết SQL chính xác hơn. Với việc setup cụ thể như vậy, bạn gần như chỉ cần chat bình thường, hỏi “Cho mình xem doanh số của Mỹ tháng 1” là AI sẽ tự viết SQL và trả về kết quả chính xác!
Demo & Kiểm Tra Kết Quả
Giờ là lúc kiểm tra xem AI agent của chúng ta hoạt động như thế nào! Mình sẽ thử một số câu hỏi phân tích dữ liệu cơ bản để xem nó hoạt động ra sao.
Các Câu Hỏi Demo:
- “Cung cấp cho mình doanh số bán hàng và số hộp socola bán được của thị trường UK”
- “Top 3 mặt hàng có doanh số cao nhất của UK là gì?”
- “So sánh top 3 mặt hàng bán chạy giữa UK và Mỹ”
- “Phân tích kết quả kinh doanh của thị trường Úc trong tháng 1 năm 2022”
Kết quả rất ấn tượng! AI agent có thể tự động viết SQL queries, trả về kết quả chính xác, và thậm chí đưa ra nhận xét so sánh giữa các tháng. Ví dụ, khi yêu cầu phân tích thị trường Úc, nó tự động tính toán các chỉ số quan trọng như tổng doanh thu, số đơn hàng, doanh thu trung bình mỗi đơn và so sánh với tháng trước.
Lưu Ý Quan Trọng:
Mặc dù AI agent rất mạnh mẽ, mình vẫn phát hiện một số sai sót trong tính toán phần trăm so sánh giữa các tháng. Điều này nhắc nhở chúng ta rằng dù kết quả AI trả về có vẻ rất đúng, chúng ta vẫn nên double-check lại trước khi trình bày với sếp hoặc khách hàng. AI là công cụ tuyệt vời để tăng tốc quá trình phân tích, nhưng con người vẫn cần kiểm chứng kết quả cuối cùng!
Nếu muốn cải thiện agent này, bạn có thể chỉnh sửa system prompt để yêu cầu nó phân tích sâu hơn, ví dụ như tự động liệt kê top 5 nhân viên bán hàng xuất sắc nhất, top 5 mặt hàng bán chạy nhất, hoặc top 5 người yếu nhất mỗi khi bạn yêu cầu phân tích kết quả kinh doanh.