Xử lý Phân tích Trực tuyến (OLAP) là một công nghệ được sử dụng để sắp xếp các cơ sở dữ liệu doanh nghiệp lớn và hỗ trợ nghiệp vụ thông minh. Cơ sở dữ liệu OLAP được chia thành một hoặc nhiều cube, đồng thời, mỗi cube được người quản trị cube sắp xếp và thiết kế sao cho phù hợp với cách bạn truy xuất và phân tích dữ liệu để tạo và sử dụng các báo cáo và báo cáo PivotChart PivotTable mà bạn cần dễ dàng hơn.

Trí tuệ thương nghiệp là gì?

Một nhà phân tích kinh doanh thường muốn tìm hiểu tổng quan về doanh nghiệp, xem các xu hướng lớn hơn dựa trên dữ liệu tổng hợp và xem các xu hướng này được chia nhỏ bởi bất kỳ số biến số nào. Nghiệp vụ thông minh là quy trình trích dữ liệu từ cơ sở dữ liệu OLAP, rồi phân tích dữ liệu đó cho thông tin mà bạn có thể sử dụng để đưa ra quyết định kinh doanh sáng suốt và hành động. Ví dụ: OLAP và nghiệp vụ thông minh sẽ giúp trả lời các loại câu hỏi sau về dữ liệu nghiệp vụ:

  • So sánh tổng doanh thu của tất cả các sản phẩm trong năm 2007 với tổng doanh thu năm 2006 như thế nào?
  • Khả năng sinh lời của chúng tôi so sánh như thế nào với cùng một khoảng thời gian trong năm năm qua?
  • Khách hàng đã chi tiêu bao nhiêu tiền trong năm 2015 và hành vi đó đã thay đổi theo thời gian như thế nào?
  • Có bao nhiêu sản phẩm đã được bán tại hai quốc gia/khu vực cụ thể trong tháng này trái ngược với tháng trước?
  • Đối với mỗi nhóm tuổi của khách hàng, phân tích về lợi nhuận (cả tỷ lệ phần trăm lề và tổng) theo danh mục sản phẩm là bao nhiêu?
  • Tìm các nhân viên bán hàng đầu và cuối cùng, nhà phân phối, nhà cung cấp, khách hàng, đối tác hoặc khách hàng.

Xử lý Phân tích Trực tuyến (OLAP) là gì?

Cơ sở dữ liệu Xử lý Phân tích Trực tuyến (OLAP) tạo điều kiện cho truy vấn nghiệp vụ thông minh. OLAP là một công nghệ cơ sở dữ liệu đã được tối ưu hóa cho truy vấn và báo cáo, thay vì xử lý các giao dịch. Dữ liệu nguồn cho OLAP là cơ sở dữ liệu Xử lý Giao dịch Trực tuyến (OLTP) vốn thường được lưu trữ trong các kho dữ liệu. Dữ liệu OLAP lấy từ dữ liệu lịch sử này và được tổng hợp thành các cấu trúc cho phép phân tích tinh vi. Dữ liệu OLAP cũng được sắp xếp theo cấu trúc phân cấp và lưu trữ trong cube thay vì bảng. Đây là một công nghệ tinh vi sử dụng cấu trúc đa chiều để cung cấp quyền truy nhập nhanh vào dữ liệu phục vụ cho việc phân tích. Tổ chức này giúp dễ dàng cho báo cáo PivotTable hoặc báo cáo PivotChart hiển thị các bản tóm tắt ở mức cao, chẳng hạn như tổng doanh số trong toàn bộ quốc gia hoặc khu vực, đồng thời cũng hiển thị chi tiết về các site có doanh số đặc biệt mạnh hoặc yếu.

Cơ sở dữ liệu OLAP được thiết kế để tăng tốc quá trình truy xuất dữ liệu. Vì máy chủ OLAP, chứ không Microsoft Office Excel các giá trị tóm tắt nên sẽ có ít dữ liệu cần được gửi đến máy chủ Excel khi bạn tạo hoặc thay đổi báo cáo. Phương pháp này cho phép bạn làm việc với số lượng dữ liệu nguồn lớn hơn nhiều so với khi dữ liệu được tổ chức trong cơ sở dữ liệu truyền thống, trong đó Excel truy xuất tất cả các bản ghi riêng lẻ, rồi tính toán các giá trị tóm tắt.

Cơ sở dữ liệu OLAP chứa hai loại dữ liệu cơ bản: số đo, là dữ liệu số, số lượng và giá trị trung bình mà bạn sử dụng để đưa ra quyết định kinh doanh có đầy đủ thông tin và chiều, là các thể loại mà bạn sử dụng để sắp xếp các số đo này. Cơ sở dữ liệu OLAP giúp sắp xếp dữ liệu theo nhiều cấp độ chi tiết, sử dụng cùng các thể loại mà bạn đã quen thuộc để phân tích dữ liệu.

Các phần sau đây mô tả chi tiết về từng cấu phần:

Cube     Cấu trúc dữ liệu tổng hợp các số đo theo các mức và cấu trúc phân cấp của từng kích thước mà bạn muốn phân tích. Các khối kết hợp một số kích thước, chẳng hạn như thời gian, địa lý và dòng sản phẩm, với dữ liệu tóm tắt, chẳng hạn như số liệu bán hàng hoặc hàng tồn kho. Các cube không phải là “cube” trong một nghĩa toán học thực sự vì chúng không nhất thiết phải có cạnh bằng nhau. Tuy nhiên, chúng là một siêu biến đổi của khái niệm phức tạp.

Thước đo     Tập giá trị trong một cube dựa trên một cột trong bảng dữ kiện của khối và thường là các giá trị số. Giá trị đo là các giá trị trung tâm trong khối được xử lý trước, tổng hợp và phân tích. Ví dụ phổ biến bao gồm doanh số, lợi nhuận, doanh thu và chi phí.

Thành viên      Một mục trong cấu trúc phân cấp đại diện cho một hoặc nhiều lần xuất hiện dữ liệu. Một thành viên có thể là duy nhất hoặc không phải thống nhất. Ví dụ: 2007 và 2008 đại diện cho các thành viên duy nhất ở cấp độ năm theo chiều thời gian, trong khi January đại diện cho các thành viên không phảiunique ở mức tháng vì có thể có nhiều hơn một Tháng Một trong chiều thời gian nếu nó chứa dữ liệu trong nhiều năm.

Phần tử được tính toán     Một phần tử của một kích thước có giá trị được tính toán tại thời gian chạy bằng cách sử dụng một biểu thức. Giá trị phần tử được tính có thể được lấy từ giá trị của các phần tử khác. Ví dụ: có thể xác định một phần tử được tính, Lợi nhuận bằng cách trừ giá trị của thành viên, Chi phí, từ giá trị của thành viên, Doanh thu.

Kích thước     Một tập hợp các cấu trúc phân cấp có tổ chức của các cấp trong một cube mà người dùng hiểu và dùng làm cơ sở để phân tích dữ liệu. Ví dụ, một chiều địa lý có thể bao gồm các mức cho Quốc gia/Khu vực, Tiểu bang/Tỉnh và Thành phố. Hoặc, chiều thời gian có thể bao gồm cấu trúc phân cấp với các mức cho năm, quý, tháng và ngày. Trong báo cáo PivotTable hoặc báo PivotChart, mỗi cấu trúc phân cấp trở thành một tập hợp các trường mà bạn có thể bung rộng và thu gọn để hiển thị các mức thấp hơn hoặc cao hơn.

Cấu trúc phân cấp     Cấu trúc cây lô-gic sắp xếp các thành viên của kích thước để mỗi thành viên có một phần viên mẹ và không thành viên con trở lên. Trẻ là thành viên thuộc mức thấp hơn kế tiếp trong cấu trúc phân cấp có liên quan trực tiếp đến thành viên hiện tại. Ví dụ, trong cấu trúc phân cấp Thời gian có chứa các cấp Quý, Tháng và Ngày, Tháng Một là con của Q1. Cha mẹ là thành viên thuộc cấp độ cao hơn kế tiếp trong cấu trúc phân cấp có liên quan trực tiếp đến thành viên hiện tại. Giá trị mẹ thường là một tổng hợp các giá trị của tất cả các con của nó. Ví dụ, trong cấu trúc phân cấp Thời gian có chứa các cấp bậc Quý, Tháng và Ngày, Q1 là bậc mẹ của Tháng Một.

Cấp độ     Trong cấu trúc phân cấp, dữ liệu có thể được tổ chức thành các mức chi tiết thấp hơn và cao hơn, chẳng hạn như mức Năm, Quý, Tháng và Ngày trong cấu trúc phân cấp Thời gian.

Các tính năng OLAP trong Excel

Truy xuất dữ liệu OLAP     Bạn có thể kết nối với nguồn dữ liệu OLAP như cách bạn làm với các nguồn dữ liệu bên ngoài khác. Bạn có thể làm việc với các cơ sở dữ liệu được tạo bằng Dịch vụ OLAP Microsoft SQL Server phiên bản 7.0, Microsoft SQL Server Analysis Services phiên bản 2000 và Microsoft SQL Server Analysis Services phiên bản 2005, các sản phẩm máy chủ Microsoft OLAP. Excel cũng có thể làm việc với các sản phẩm OLAP của bên thứ ba tương thích với OLE-DB cho OLAP.

Bạn chỉ có thể hiển thị dữ liệu OLAP dưới dạng báo cáo PivotTable hoặc báo cáo PivotChart hoặc trong một hàm trang tính được chuyển đổi từ báo cáo PivotTable, chứ không hiển thị dưới dạng báo cáo miền dữ liệu ngoài. Bạn có thể lưu báo cáo OLAP PivotTable và báo cáo PivotChart trong mẫu báo cáo, đồng thời bạn có thể tạo tệp Kết nối Dữ liệu Office (ODC) (.odc) để kết nối với cơ sở dữ liệu OLAP cho truy vấn OLAP. Khi bạn mở tệp ODC, một tệp Excel sẽ hiển thị báo cáo PivotTable trống, sẵn sàng để bạn bố trí.

Tạo tệp cube để sử dụng ngoại tuyến     Bạn có thể tạo tệp khối ngoại tuyến (.cub) với một tập hợp con dữ liệu từ cơ sở dữ liệu máy chủ OLAP. Sử dụng tệp cube ngoại tuyến để làm việc với dữ liệu OLAP khi bạn không kết nối với mạng của mình. Cube cho phép bạn làm việc với lượng dữ liệu lớn hơn trong báo cáo PivotTable hoặc báo cáo PivotChart hơn so với khi có thể và tăng tốc việc truy xuất dữ liệu. Bạn chỉ có thể tạo tệp cube nếu bạn sử dụng một Phần mềm cung cấp truy cập OLAP, chẳng hạn như Microsoft SQL Analysis Services Server phiên bản 2005, vốn hỗ trợ tính năng này.

Hành động Máy chủ     Hành động máy chủ là một tính năng tùy chọn nhưng hữu ích mà người quản trị OLAP cube có thể xác định trên một máy chủ sử dụng một phần mềm khối hoặc số đo như một tham số vào truy vấn để lấy các chi tiết trong cube, hoặc để bắt đầu một ứng dụng khác, chẳng hạn như một trình duyệt. Excel hỗ trợ URL, Báo cáo, Tập hàng, Truy sâu Qua và Mở rộng đến hành động máy chủ Chi tiết nhưng không hỗ trợ tính năng Độc quyền, Câu lệnh và Tập dữ liệu.

KPIs      KPI là một số đo được tính toán đặc biệt được xác định trên máy chủ, cho phép bạn theo dõi “chỉ số hiệu suất then chốt” bao gồm trạng thái (Giá trị hiện tại có đáp ứng một số cụ thể không?) và xu hướng (giá trị theo thời gian là gì?). Khi các biểu tượng này được hiển thị, Máy chủ có thể gửi các biểu tượng liên quan tương tự như bộ biểu tượng Excel mới để biểu thị ở trên hoặc dưới mức trạng thái (chẳng hạn như biểu tượng Ngừng ánh sáng) hoặc một giá trị đang thịnh hành lên hay xuống (chẳng hạn như biểu tượng mũi tên định hướng).

Định dạng Máy chủ     Người quản trị cube có thể tạo các số đo và các phần tử được tính với định dạng màu, định dạng phông chữ và các quy tắc định dạng có điều kiện, mà có thể được chỉ định là quy tắc kinh doanh tiêu chuẩn của công ty. Ví dụ: định dạng máy chủ cho lợi nhuận có thể là định dạng số của tiền tệ, màu xanh lục ô nếu giá trị lớn hơn hoặc bằng 30.000 và màu đỏ nếu giá trị nhỏ hơn 30.000 và kiểu phông đậm nếu giá trị nhỏ hơn 30.000 và thông thường nếu lớn hơn hoặc bằng 30.000.

Office hiển thị     Người quản trị cube có thể xác định bản dịch cho dữ liệu và lỗi trên máy chủ cho người dùng cần xem thông tin PivotTable bằng ngôn ngữ khác. Tính năng này được xác định là thuộc tính kết nối tệp và thiết đặt quốc gia/khu vực trên máy tính của người dùng phải tương ứng với ngôn ngữ hiển thị.

Các cấu phần phần mềm mà bạn cần để truy nhập nguồn dữ liệu OLAP

Một nhà cung cấp OLAP     Để thiết lập nguồn dữ liệu OLAP cho nhà Excel, bạn cần một trong các nhà cung cấp OLAP sau đây:

  • Nhà cung cấp Microsoft OLAP     Excel bao gồm phần mềm trình điều khiển nguồn dữ liệu và máy khách mà bạn cần truy nhập vào các cơ sở dữ liệu được tạo bằng Dịch vụ OLAP Microsoft SQL Server phiên bản 7.0, Microsoft SQL Server Dịch vụ OLAP phiên bản 2000 (8.0) và Microsoft SQL Server Analysis Services phiên bản 2005 (9.0).
  • Nhà cung cấp OLAP bên thứ ba     Đối với các sản phẩm OLAP khác, bạn cần cài đặt trình điều khiển và phần mềm máy khách bổ sung. Để sử dụng các Excel tính năng mới để làm việc với dữ liệu OLAP, sản phẩm của bên thứ ba phải phù hợp với tiêu chuẩn OLE-DB cho OLAP và tương thích Microsoft Office hợp. Để biết thông tin về việc cài đặt và sử dụng nhà cung cấp OLAP bên thứ ba, hãy tham vấn người quản trị hệ thống hoặc nhà cung cấp cho sản phẩm OLAP của bạn.

Cơ sở dữ liệu máy chủ và tệp cube     Phần mềm Excel OLAP hỗ trợ các kết nối đến hai loại cơ sở dữ liệu OLAP. Nếu cơ sở dữ liệu trên máy chủ OLAP sẵn dùng trên mạng của bạn, bạn có thể truy xuất dữ liệu nguồn trực tiếp từ máy chủ đó. Nếu bạn có tệp tệp khối vuông ngoại tuyến chứa dữ liệu OLAP hoặc tệp định nghĩa khối, bạn có thể kết nối với tệp đó và truy xuất dữ liệu nguồn từ tệp đó.

Nguồn dữ liệu     Nguồn dữ liệu cung cấp cho bạn quyền truy nhập vào tất cả dữ liệu trong cơ sở dữ liệu OLAP hoặc tệp khối ngoại tuyến. Sau khi bạn tạo nguồn dữ liệu OLAP, bạn có thể căn cứ báo cáo trên nguồn dữ liệu đó và trả dữ liệu OLAP về Excel dưới dạng báo cáo PivotTable hoặc báo cáo PivotChart, hoặc trong một hàm trang tính được chuyển đổi từ báo cáo PivotTable.

Truy vấn Microsoft     Bạn có thể dùng Truy vấn để truy xuất dữ liệu từ cơ sở dữ liệu bên ngoài chẳng hạn như Microsoft SQL hoặc Microsoft Access. Bạn không cần sử dụng Truy vấn để truy xuất dữ liệu từ PivotTable OLAP được kết nối với một tệp cube.

Sự khác biệt về tính năng giữa dữ liệu nguồn OLAP và không phải OLAP

Nếu bạn làm việc với báo cáo PivotTable và PivotChart báo cáo từ cả OLAP dữ liệu nguồn và các kiểu dữ liệu nguồn khác, bạn sẽ nhận thấy một số khác biệt về tính năng.

Truy xuất dữ liệu     Máy chủ OLAP trả về dữ liệu mới Excel mỗi lần bạn thay đổi bố trí báo cáo. Với các kiểu dữ liệu nguồn bên ngoài khác, bạn truy vấn cùng lúc tất cả dữ liệu nguồn hoặc bạn có thể đặt tùy chọn thành truy vấn chỉ khi hiển thị các mục trường bộ lọc báo cáo khác nhau. Bạn cũng có một vài tùy chọn khác để làm mới báo cáo.

Trong báo cáo dựa trên dữ liệu nguồn OLAP, thiết đặt trường bộ lọc báo cáo không sẵn dùng, truy vấn nền không sẵn dùng và thiết đặt tối ưu hóa bộ nhớ không sẵn dùng.

Lưu ý: Thiết đặt tối ưu hóa bộ nhớ cũng không sẵn dùng cho nguồn dữ liệu OLEDB và cho báo cáo PivotTable dựa trên một phạm vi ô.

Loại trường    Dữ liệu nguồn OLAP, kích thước có thể chỉ được dùng làm hàng (chuỗi), cột (danh mục) hoặc trường trang. Chỉ có thể sử dụng trường đo làm trường giá trị. Đối với các kiểu dữ liệu nguồn khác, tất cả các trường có thể được sử dụng trong bất kỳ phần nào của báo cáo.

Truy nhập vào dữ liệu chi tiết     Đối với dữ liệu nguồn OLAP, máy chủ xác định mức độ chi tiết sẵn dùng và tính toán giá trị tóm tắt, vì vậy, các bản ghi chi tiết tạo nên giá trị tóm tắt có thể không sẵn dùng. Tuy nhiên, máy chủ có thể cung cấp thông trường đặc tính mà bạn có thể hiển thị. Các kiểu dữ liệu nguồn khác không có trường thuộc tính nhưng bạn có thể hiển thị chi tiết cơ sở cho các giá trị trường dữ liệu và cho các mục, đồng thời bạn có thể hiển thị các mục không có dữ liệu.

Các trường bộ lọc báo cáo OLAP có thể không có mục Tất cả và lệnh Hiển thị Trang Bộ lọc Báo cáo không sẵn dùng.

Thứ tự sắp xếp ban đầu     Đối với dữ liệu nguồn OLAP, trước tiên các mục sẽ xuất hiện theo thứ tự mà máy chủ OLAP trả về. Sau đó, bạn có thể sắp xếp hoặc sắp xếp lại thủ công các mục. Đối với các kiểu dữ liệu nguồn khác, các mục trong báo cáo mới đầu tiên sẽ xuất hiện được sắp xếp theo thứ tự tăng dần theo tên mục.

Tính toán     Máy chủ OLAP cung cấp trực tiếp các giá trị tóm tắt cho báo cáo, vì vậy bạn không thể thay đổi hàm tổng hợp cho các trường giá trị. Đối với các kiểu dữ liệu nguồn khác, bạn có thể thay đổi hàm tổng hợp cho một trường giá trị và sử dụng nhiều hàm tổng hợp cho cùng một trường giá trị. Bạn không thể tạo trường được tính toán hoặc mục được tính toán trong báo cáo với dữ liệu nguồn OLAP.

Tổng phụ     Trong báo cáo với dữ liệu nguồn OLAP, bạn không thể thay đổi hàm tổng hợp cho tổng phụ. Với các kiểu dữ liệu nguồn khác, bạn có thể thay đổi các hàm tổng hợp tổng phụ và hiển thị hoặc ẩn tổng phụ cho tất cả các trường hàng và cột.

Đối với dữ liệu nguồn OLAP, bạn có thể bao gồm hoặc loại trừ các mục ẩn khi tính tổng phụ và tổng chính. Đối với các kiểu dữ liệu nguồn khác, bạn có thể đưa các mục trường bộ lọc báo cáo ẩn vào tổng phụ nhưng các mục ẩn trong các trường khác sẽ được loại trừ theo mặc định.

Nguồn: support.microsoft.com

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *