19
TRENDS in data warehousing Pham Hoang Anh, Phan Quang Huy, Nguyen Thanh Tung Lecture : mrs. Le Phuong Chi

Trends in data warehousing

  • Upload
    a-p

  • View
    149

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Trends in data warehousing

TRENDS in data warehousingPham Hoang Anh, Phan Quang Huy, Nguyen Thanh TungLecture : mrs. Le Phuong Chi

Page 2: Trends in data warehousing

Data warehouse là gì?• Data warehouse chính là database chuyên dùng cho tạo báo cáo và phân tích

dữ liệu• Nó vừa hỗ trợ các truy vấn phức tạp, vừa là điểm tập trung dữ liệu từ nhiều

nguồn khác nhau để có được thông tin phân tích đầy đủ nhất• => Data warehouse là một tập hợp dữ liệu hướng chủ đề, toàn vẹn, không bị

rò rỉ mất mát và có giá trị lịch sử

Page 3: Trends in data warehousing

Cụ thể các tính chất đó như sau:

Time – varying

Nonvolatile

Integrated

Subject – oriented• Tính hướng chủ đề • Tính toàn vẹn • Tính bất biến • Giá trị lịch sử

Page 4: Trends in data warehousing

• Data warehouse cho phép người dùng ở mức quản lý, ra quyết định thực hiện các phép phân tích tương tác với data bằng hệ thống xử lý phân tích trực tuyến (online analytical processing – OLAP).

Page 5: Trends in data warehousing

Ngoài ra data warehouse cũng được dùng cho báo cáo, data mining và phân tích thống kê. Database và data warehouse, do đó chỉ khác nhau về mặt khái niệm, một database nếu dùng riêng cho các mục đích trên cũng được coi là data warehouse.

Page 6: Trends in data warehousing

Như vậy, nếu như database được ví như cái tủ sách cá nhân, nơi người ta thường xuyên tra cứu, cập nhật, hiệu đính, ghi chú vào lề, thêm mới hoặc chuyển sách đi, thì data warehouse lại được so sánh với thư viện quốc gia, nơi các tài liệu kinh điển được đưa đến liên tục để lưu trữ và tham khảo, không ai sửa chữa hoặc chuyển chúng qua chỗ nào khác cả.

Page 7: Trends in data warehousing

CONTINUED GROWTH IN DATA WAREHOUSE

Category 1 Category 2 Category 3 Category 4

4.3

2.5

3.5

4.5

2.4

4.4

1.8

2.8

2 2

3

5

Series 1 Series 2 Series 3

Page 8: Trends in data warehousing

Database nghiệp vụ DataWarehouseNgười dùng Nhân viên vận hành Cán bộ quản lý, NV phân tích số liệu

Loại hình sử dụng Dự đoán được, lặp đi lặp lại Truy xuất đột xuất, không xác định trước

Dữ liệu Hiện tại, ở mức chi tiết Lịch sử, ở mức tổng hợp

Tổ chức dữ liệu Theo yêu cầu nghiệp vụ Theo vấn đề phân tích

Cấu trúc dữ liệu Tối ưu cho các giao dịch nhỏ Tối ưu cho các truy vấn phức tạp

Tần suất truy cập Cao TB -> thấp

Loại truy cập Đọc, ghi, cập nhật, xóa Đọc , ghi

Số lượng bản ghi mỗi lần truy cập Ít Rất lớn

Thời gian truy cập Ngắn Tương đối dài

Mức độ xử lý song song Cao, các tác vụ đồng thời trên 1 bản ghi nhất định xảy ra thường xuyên Thấp

Tần suất update data Thường xuyên Không update

Dư thừa dữ liệu Thấp (Bảng đã được chuẩn hóa) Cao (Chưa chuẩn hóa)

Mô hình dữ liệu Mô hình quan hệ thực thể Mô hình đa chiều

Mô hình triển khai Toàn bộ hệ thống Tăng dần theo DataMart

So sánh database nghiệp vụ và data warehouse

Page 9: Trends in data warehousing

REVOLUTION

• Hơn một nửa các công ty high-end business ở Mỹ đã sử dụng dw hoặc có kế hoạch bổ sung cho doanh nghiệp mình

• Trong ngành công nghiệp, từ các chuỗi cửa hàng bán lẻ đến các tổ chức tài chính, từ các doanh nghiệp tư đến các cơ quan nhà nước, hang không đến các tập đoàn dược , dw đã cách mạng hóa cách thức con người thực hiện các phân tích kinh doanh và đưa ra quyết định chiến lược.

• Mỗi một công ty đều có 1 dw riêng và nhận ra được nhiều lợi ích to lớn.

Dw dường như ngày càng phổ biến trong các doanh nghiệp cũng như đã được giảng dạy đại trà ở trường học

Page 10: Trends in data warehousing

XU HƯỚNG- TRENDSDw không chỉ là một hiện tượng mới. Hầu hết các doanh nghiệp lớn đều có dw, nhưng vấn đề quản lý lại chưa được tối ưu. Trong vài năm tới, sự phát triển của dw sẽ là rất lớn khi mà các sản phẩm và công nghệ mới thường xuyên được update.

Page 11: Trends in data warehousing

Trend # 1: Outsourcing

• Mặc dù các doanh nghiệp chưa bắt đầu để thuê ngoài dw thực tế của họ, họ đang gia công phần mềm ứng dụng khác và nói rộng ra, các dữ liệu được sử dụng và được tạo ra bởi các ứng dụng. Việc sử dụng của gia công phần mềm được phát triển nhanh chóng.

Page 12: Trends in data warehousing

Trend # 2: Hub Versus Relational Databases• Trong một nỗ lực để kiểm soát chi phí và cải thiện hiệu suất, các doanh nghiệp

đang ngày càng thực hiện các trung tâm dữ liệu trong dw của họ thay vì sử dụng cơ sở dữ liệu quan hệ. Giữ dữ liệu trong một cơ sở dữ liệu quan hệ có thể khá đắt, chi phí từ ba đến năm lần so với việc giữ dữ liệu trong một kho lưu trữ nonrelational. Ngoài ra, các truy vấn trên các cửa hàng dữ liệu nonrelational có thể tốt hơn các truy vấn trên cơ sở dữ liệu quan hệ. Với hy vọng đạt được những lợi ích này, các doanh nghiệp đang chuyển sang các tập tin nén phẳng để thay thế một số RDBMS của họ. Mặc dù có những lợi ích hiệu suất và chi phí-hiệu quả của các trung tâm dữ liệu, họ được giới hạn bởi không có SQL và không thích hợp cho tất cả các tình huống.

Page 13: Trends in data warehousing

Trend # 3: Active Data Warehouses• Khi các doanh nghiệp phải đối mặt với áp lực cạnh tranh để tăng tốc độ của

việc ra quyết định, dw phải tiến hóa để hỗ trợ phân tích thời gian thực và hành động. "Active" dw là một cách để đáp ứng nhu cầu này.

Page 14: Trends in data warehousing

Trend # 4: Fusion với CRM• Quản lý quan hệ khách hàng (CRM) là một trong những sáng kiến kinh doanh

phổ biến nhất trong các doanh nghiệp hiện nay. CRM giúp doanh nghiệp thu hút khách hàng mới và phát triển lòng trung thành của các khách hàng hiện tại với kết quả cuối cùng của việc tăng doanh thu và nâng cao lợi nhuận. Một dw chứa các thông tin doanh nghiệp cần phải thực sự hiểu khách hàng của mình và, do đó, ngày càng có vẻ là một điều kiện tiên quyết cho một sáng kiến CRM thành công.

Page 15: Trends in data warehousing

Trend # 5: Growing Number of End Users• Là nhà cung cấp làm cho dw và công cụ kinh doanh thông minh dễ tiếp cận

hơn đến công chúng, số lượng người dùng cuối dw ngày càng tăng nhanh. Survey.com dự đoán rằng số lượng người dùng dw sẽ nhiều hơn gấp bốn lần vào năm 2002, với trung bình 2.718 người dùng cá nhân và 609 người dùng đồng thời mỗi kho. Ngoài ra để đối phó với sự gia tăng số lượng người dùng cuối, các đội dw sẽ cần để phục vụ cho các loại khác nhau của người dùng cuối.

Page 16: Trends in data warehousing

Trend # 6: Các truy vấn phức tạp hơn• Ngoài ra để trở thành nhiều hơn, truy vấn đối với dw cũng sẽ trở nên phức tạp

hơn. Mong đợi của người dùng đang ngày càng tăng về khả năng để có được chính xác các loại thông tin cần thiết, khi cần thiết. Đơn giản là tập hợp dữ liệu không còn đủ để đáp ứng những người dùng muốn có thể đi sâu vào nhiều khía cạnh. Ví dụ, nó có thể không đủ để cung cấp một báo cáo bán hàng khu vực mỗi tuần. Người dùng có thể muốn xem xét các dữ liệu bằng kích thước tùy chỉnh - có lẽ bởi một đặc tính khách hàng nhất định, một địa điểm bán hàng cụ thể hoặc thời điểm mua hàng.

• Người dùng cũng đang đòi hỏi các công cụ kinh doanh thông minh tinh vi hơn.

Page 17: Trends in data warehousing

Trend # 7: Tích hợp Custom View• Lấy một cái nhìn 360- độ của khách hàng được nhanh chóng trở thành những

lý do phổ biến nhất đối với quy mô lớn nỗ lực của dw. Các doanh nghiệp muốn có được một bức tranh hoàn chỉnh của từng khách hàng trên tất cả các kênh truyền hình và tất cả các ngành nghề kinh doanh. Trong khi điều này nghe có vẻ giống như một khái niệm đơn giản, nó có thể rất khó khăn để thực hiện. Nhiều doanh nghiệp có lịch sử được tổ chức xung quanh sản phẩm, khu vực địa lý hoặc kích thước-kinh doanh khác có liên quan, và các hệ thống CNTT của họ phản ánh điều này. Di chuyển đến một cái nhìn khách hàng trung tâm đòi hỏi một sự thay đổi lớn trong cách họ thu thập, lưu trữ và phổ biến thông tin. Các doanh nghiệp phải tích hợp các nguồn dữ liệu được phát sinh đề cập trước đó và phải chắc chắn để xử lý các vấn đề chất lượng dữ liệu để khách hàng được thể hiện chính xác trên tất cả các hệ thống.

Page 18: Trends in data warehousing

Trend # 8: Bùng nổ Data Volumes• Một trong những vấn đề công nghệ lớn nhất đối với các doanh nghiệp hiện nay

là sự bùng nổ về số lượng dữ liệu được dự kiến sẽ xảy ra trong vài năm tới. Theo Gartner, trong năm 2004 các doanh nghiệp sẽ được quản lý dữ liệu nhiều hơn 30 lần so với năm 1999. E-kinh doanh là một trong những thủ phạm chính trong vụ nổ dữ liệu, như dòng kích dữ liệu dự kiến sẽ nhanh chóng thêm terabytes với dw. Khi số lượng các kênh tiếp xúc khách hàng khác phát triển, họ thêm dữ liệu nhiều hơn. Nhu cầu của người dùng cuối leo thang cũng đóng góp một phần, như tổ chức thu thập thêm thông tin và lưu trữ nó trong một thời gian dài hơn.

Page 19: Trends in data warehousing

Thanks for watching…