Hướng dẫn sử dụng power bi Informational, Transactional

Tiếp diễn chủ đề kết nối Power BI với nguồn dữ liệu Excel ở trên Desktop đã được giới thiệu trước đây, chúng ta phân tích một case study phức tạp hơn nhưng cũng rất hay gặp trong thực tế.

Trong case study, giả sử bạn đang quản lý chuỗi cửa hàng ở nhiều khu vực khác nhau và dữ liệu bán hàng, dữ liệu hàng hóa, tồn kho đang được lưu trữ ở nhiều file excel, mỗi file đại diện cho một khu vực. Trên mỗi file có sheet dữ liệu bán hàng, sheet dữ liệu hàng hóa, sheet dữ liệu tồn kho,… Vậy làm cách nào để có thể import và append chúng thành các bảng tương ứng? Chúng ta cùng dành 5 phút để tìm hiểu về cách làm trong phần sau nhé.

Mục lục

MÔ TẢ CHUNG VỀ CASE STUDY

Bạn quản lý 2 cửa hàng tại Hà Nội và Hồ Chí Minh, mỗi cửa hàng quản lý tình hình kinh doanh bằng file excel (bao gồm đơn hàng và danh sách sản phẩm). Với tính năng Connect data từ Folder, Power BI sẽ tự động giúp bạn tổng hợp data từ những file excel có cấu trúc giống nhau (Cùng tên cột, tên sheet) thành một bảng data duy nhất. Sau khi đã kết nối xong, cứ mỗi khi update data hoặc có thêm file quản lý của cửa hàng mới thì Power BI sẽ tự động update theo data mới nhất đó.

Về tổng quan thì bộ dữ liệu quản lý bán hàng sẽ có cấu trúc chung như sau:

  • File excel quản lý của hai cửa hàng tại Hà Nội và Hồ Chí Minh quản lý chung trong 1 folder.
    Hướng dẫn sử dụng power bi	Informational, Transactional

Trong mỗi file excel có 2 sheet, gồm sheet “Product” và sheet “Transaction”.

  • Sheet “Product”: Bao gồm các thông tin về sản phẩm cửa hàng đang quản lý như tên sản phẩm, giá, chi nhánh cửa hàng.
    Hướng dẫn sử dụng power bi	Informational, Transactional
  • Sheet “Transaction”: Bao gồm thông tin về mã sản phẩm của đơn hàng, số lượng và chi nhánh cửa hàng.
    Hướng dẫn sử dụng power bi	Informational, Transactional

Output sau khi thực hiện:

Sau khi kết nối được tới folder chứa các file quản lý cửa hàng, thực hiện theo các bước append và tranform (Theo như hướng dẫn tại phần “CÁC BƯỚC THỰC HIỆN”), thì kết quả chúng ta mong muốn sẽ là thông tin về đơn hàng và sản phẩm tại các cửa hàng được tổng hợp lại chung một nơi, giúp việc phân tích và quản lý dễ dàng hơn. Cụ thể:

  • Hai table “Product và “Transaction” đã được tổng hợp thông tin từ 2 cửa hàng tại Hà Nội và Hồ Chí Minh.
    Hướng dẫn sử dụng power bi	Informational, Transactional

CÁC BƯỚC THỰC HIỆN

Bước 1: Gộp chung các file cần tổng hợp vào 1 Folder.

Bước 2: Connect PBI tới folder chứa data.

Tạo Connect từ Power BI tới Folder đó. Vào “Get Data” => Chọn “More…” để hiển thị tất cả các loại Connect => Chọn “File” => chọn “Folder” và ấn “Connect”. Tại cửa sổ hiện ra thì mọi người trỏ đến đường dẫn của Folder ở bước 1.

Hướng dẫn sử dụng power bi	Informational, Transactional

Bước 3: Transform data.

Sau khi trỏ đến Folder và Connect được thì Power BI cho chúng ta một số Option để lựa chọn như sau:

Hướng dẫn sử dụng power bi	Informational, Transactional

  • Combine & Transform Data: Trong trường hợp bạn muốn Combine data chỉ từ 1 sheet trong các file thành phần, đồng thời bạn cũng muốn Transform data sau khi đã Combine (Thêm, sửa xóa data; Tạo thêm cột thông tin mới…) thì nên dùng mode này. Power BI sẽ tự động thực hiện các bước đằng sau để gộp data từ các file excel trong folder và trả ra một table duy nhất. Bạn sẽ thực hiện các thao tác Transform trên table này.
  • Combine & Load: Nếu bạn muốn Combine data chỉ từ 1 sheet giống như trên và muốn load luôn data để thực hiện Visualize thì đây là mode bạn nên chọn.
  • Load: Mode này Power BI chỉ thực hiện load các meta data của folder đó lên (Các thông tin về tên file, định dạng, ngày tạo, folder path…). Mode này thường ít được sử dụng trong Power BI vì nó không đáp ứng nhu cầu combine data.
  • Transform: Nếu trong các file Excel của bạn có nhiều sheet cần Combine lại thì đây là mode hợp lý hơn cả. Thực tế chúng ta vẫn có thể dùng Mode “Combine & Transform Data”, nhưng như vậy sẽ phải lặp lại các bước 1-3 nhiều lần, gây bất tiện cho người sử dụng. Trong Case Study này chúng ta sẽ sử dụng Mode “Transform Data”.

Bước 4: Append data.

Với các mode “Combine & Transform Data”, “Combine & Load” thì data đã được combine lại nên chúng ta không cần phải làm gì nữa cả. Còn đối với mode “Transform” dùng để combine nhiều sheet trong các file excel, chúng ta cần phải xử lý thêm một số bước. Khi chọn mode “Transform” thì giao diện Power Query Editor sẽ trông như này:

Để tiện Combine nhiều sheet, chúng ta nên tạo reference từ Raw Data chưa transform gì cả. Việc tạo reference giúp cho ta có thể transform và combine data từng sheet mà không phải làm trực tiếp trên Raw Data. Ví dụ trong case study của mình đề cập trong bài viết này có 2 sheet, thì ta sẽ tạo ra 2 bảng reference từ Raw Data rồi mới thực hiện combine & transform.

Hướng dẫn sử dụng power bi	Informational, Transactional

Sau khi tạo bảng reference, ta chọn vào cột Content => Chọn “Combine” hoặc ấn vào biểu tượng mũi tên xuống ở góc bên phải của cột Content.

Hướng dẫn sử dụng power bi	Informational, Transactional

Lúc này, Power BI sẽ hiện ra popup để chúng ta chọn sheet data nào muốn combine, mọi người tự chọn theo nhu cầu cá nhân rồi nhấn “OK”.

Hướng dẫn sử dụng power bi	Informational, Transactional

Đến bước này chúng ta đã thực hiện xong việc combine data của một sheet. Khi combine xong thì giao diện trong Power Query Editor sẽ giống ảnh sau:

Hướng dẫn sử dụng power bi	Informational, Transactional

Ở bên trái là các bước tự sinh ra của Power BI để combine data lại. Mọi người không cần quá quan tâm đến các bước này, chúng ta chỉ cần quan tâm đến table output cuối cùng (Khung màu xanh). Nếu muốn tìm hiểu sâu hơn, mọi người có thể tham khảo tại tài liệu của Microsoft (https://learn.microsoft.com/en-us/power-bi/transform-model/desktop-combine-binaries).

Làm tương tự với các sheet còn lại của file excel (Sử dụng bảng reference đã tạo). Sau khi thực hiện combine và transform xong thì mọi người có thể close Power Query Editor và nhấn Apply.

MỘT SỐ LƯU Ý KHI SỬ DỤNG LOAD DATA FROM FOLDER

  • Các sheet thông tin có cùng ý nghĩa về data, ví dụ như sheet thông tin về transaction của cửa hàng thì cần có tên giống nhau. Tương tự, các cột thông tin có cùng ý nghĩa cũng phải có tên giống nhau. Nếu cùng là cột thông tin tên khách hàng nhưng file 1 cột thông tin là “name” còn file 2 cột thông tin là “tên” thì Power BI sẽ không hiểu được để thực hiện combine hai cột đó vào thành một.
  • Nếu vô tình chọn nhầm sheet data không đúng để combine, mọi người có thể đổi lại sheet trong Power Query Editor. Phía tay trái, trong folder chứa các bước combine tự động của Power BI, chọn folder tương ứng với table đang cần sửa => Các bạn chọn vào mục Transform File (Có biểu tượng Fx ở đầu). Trong mục công thức, các bạn sửa lại đúng tên Sheet cần combine và nhấn dấu “V” để hoàn thành.

Ví dụ sau khi Append xong bảng “Product”, chúng ta không muốn lấy data từ sheet “Product” trong file excel nữa mà muốn đổi sang sheet “Transaction”, thì chúng ta đổi tên Source từ “Product” sang “Transaction” (Như ảnh bên dưới).

Hướng dẫn sử dụng power bi	Informational, Transactional

Và kết quả bảng Product bây giờ sẽ bao gồm các thông tin liên quan đến Transaction như Transaction_id, Quantity….

Hướng dẫn sử dụng power bi	Informational, Transactional

Tổng kết

Các bài toán liên quan đến quản lý data từ nhiều file với các kiểu lưu trữ khác nhau (Excel, Googlesheet…) chúng ta sẽ rất hay gặp trong thực tế. Tùy từng bài toán cụ thể sẽ có cách xử lý khác nhau. Nhưng các bài toán đó đều có một đặc điểm chung đó là chúng ta đều phải thực hiện công việc append và transform tương tự như case study trên.