Oracle công bố cải tiến MySQL HeatWave Lakehouse

Trong một thông báo được đưa ra vào ngày đầu tiên của Oracle CloudWorld, Oracle tuyên bố rằng hiệu suất truy vấn được cải thiện của họ, dựa trên khối lượng công việc 400 TB, nhanh hơn 17 lần so với Snowflake và nhanh hơn 6 lần so với Redshift. Trong khi đó, MySQL HeatWave Lakehouse có thể tải 400 TB dữ liệu từ bộ lưu trữ đối tượng nhanh hơn gấp 8 lần so với Redshift và nhanh hơn gấp 2 lần so với Snowflake. Nhanh gấp 7 lần Snowflake

Trong một thông báo được đưa ra vào ngày đầu tiên của Oracle CloudWorld, Oracle tuyên bố rằng hiệu suất truy vấn được cải thiện của họ, dựa trên khối lượng công việc 400 TB, nhanh hơn 17 lần so với Snowflake và nhanh hơn 6 lần so với Redshift. Trong khi đó, MySQL HeatWave Lakehouse có thể tải 400 TB dữ liệu từ bộ lưu trữ đối tượng nhanh hơn gấp 8 lần so với Redshift và nhanh hơn gấp 2 lần so với Snowflake. Nhanh gấp 7 lần Snowflake

Oracle công bố cải tiến MySQL HeatWave Lakehouse

Phần bổ sung gần đây nhất cho dòng MySQL HeatWave, MySQL HeatWave Lakehouse, kết hợp xử lý giao dịch, phân tích, học máy và tự động hóa dựa trên học máy trong một cơ sở dữ liệu MySQL duy nhất. Nó mở rộng tới 512 nút và cho phép người dùng truy cập vào hàng trăm terabyte dữ liệu trong kho lưu trữ đối tượng ở nhiều định dạng tệp khác nhau, bao gồm CSV và Parquet, cũng như các bản sao lưu Aurora và Redshift

Theo điểm chuẩn tiêu chuẩn ngành, MySQL HeatWave Lakehouse, được hỗ trợ bởi kiến ​​trúc MySQL HeatWave mở rộng song song quy mô lớn, cung cấp hiệu suất tốt hơn đáng kể để thực thi truy vấn và tải dữ liệu so với các dịch vụ cơ sở dữ liệu đám mây cạnh tranh

Oracle cũng đã công bố các khả năng MySQL Autopilot mới giúp cải thiện hiệu suất và giúp sử dụng đơn giản hơn. Khách hàng có thể truy vấn dữ liệu giao dịch trong cơ sở dữ liệu MySQL và kết hợp nó với dữ liệu trong kho đối tượng bằng một truy vấn duy nhất. Giờ đây, khách hàng có thể dùng thử MySQL HeatWave Lakehouse ở phiên bản beta;

Các công ty hàng đầu trong lĩnh vực ô tô, viễn thông, bán lẻ, công nghệ cao và chăm sóc sức khỏe, cũng như những công ty di chuyển từ AWS, Google và tại chỗ, đã và đang sử dụng MySQL HeatWave cho nhiều trường hợp sử dụng, bao gồm phân tích tiếp thị,

Khách hàng của Oracle có thể kiểm tra MySQL Heatwave miễn phí trong 30 ngày và công ty cũng đang phát hành các điểm chuẩn lakehouse mới và bổ sung một số khả năng cho MySQL HeatWave Lakehouse và MySQL Autopilot

điểm chuẩn

Hiệu suất truy vấn của MySQL HeatWave Lakehouse được thể hiện bằng điểm chuẩn 400 TB TPC-H có thể truy cập công khai, với các tập lệnh có sẵn trên GitHub, sẽ là

  • Nhanh hơn 17 lần so với Snowflake
  • Nhanh hơn 6 lần so với Amazon Redshift

Đối với khối lượng công việc TPC-H 400 TB, hiệu suất tải của MySQL HeatWave Lakehouse nhanh hơn đáng kể khi tải dữ liệu từ kho lưu trữ đối tượng

  • Nhanh hơn 8 lần so với Amazon Redshift
  • 2. Nhanh hơn 7 lần so với Snowflake

Các tính năng mới được phát triển cho MySQL HeatWave Lakehouse

Các tính năng mới của MySQL HeatWave Lakehouse bao gồm

  • Khách hàng có thể truy vấn tới 400 TB dữ liệu với MySQL HeatWave Lakehouse và cụm HeatWave chia tỷ lệ thành 512 nút. Kích thước dữ liệu lớn hơn, cú pháp MySQL chuẩnKhách hàng truy vấn dữ liệu bằng cú pháp MySQL chuẩn
  • Như được thể hiện bởi cả điểm chuẩn TPC-H 10TB và 30TB, MySQL HeatWave cung cấp hiệu suất truy vấn giống nhau cho dữ liệu được lưu trữ trong cơ sở dữ liệu MySQL cũng như trên các kho lưu trữ đối tượng. Trong cả hai trường hợp, lượng nén đạt được và lượng dữ liệu tối đa có thể được xử lý trên mỗi nút đều bằng nhau
  • Khách hàng có thể tải và xử lý dữ liệu được lưu trữ ở nhiều định dạng tệp khác nhau, bao gồm CSV và Parquet, cũng như các bản sao lưu Aurora và Redshift từ AWS, sử dụng khả năng hỗ trợ nhiều định dạng tệp của MySQL HeatWave Lakehouse. Hiệu suất truy vấn là như nhau bất kể định dạng tệp mà dữ liệu được lưu trữ, cho phép khách hàng này tận dụng lợi thế của MySQL HeatWave ngay cả khi dữ liệu của họ không được lưu trong cơ sở dữ liệu MySQL
  • Khả năng truy vấn dữ liệu OLTP được lưu trữ trong cơ sở dữ liệu MySQL và kết hợp nó với dữ liệu được lưu trữ trong kho lưu trữ đối tượng. Khách hàng có thể sử dụng MySQL HeatWave Lakehouse để truy vấn dữ liệu OLTP của họ được lưu trữ trong cơ sở dữ liệu MySQL và kết hợp nó với dữ liệu được lưu trữ trong kho đối tượng. Kết quả truy vấn cập nhật theo thời gian thực để phản ánh bất kỳ thay đổi nào được thực hiện đối với dữ liệu OLTP

Các khả năng Autopilot mới của MySQL

Các tính năng MySQL Autopilot hiện có như tự động cung cấp và cải thiện kế hoạch truy vấn tự động đã được tăng cường cho MySQL HeatWave Lakehouse, giảm chi phí quản trị cơ sở dữ liệu và nâng cao hiệu suất. MySQL Autopilot cung cấp tính năng tự động hóa dựa trên máy học cho MySQL HeatWave

Các khả năng MySQL Autopilot mới bao gồm

  • Autopilot tự động xác định mối quan hệ giữa dữ liệu tệp và kiểu dữ liệu cơ sở dữ liệu bằng suy luận lược đồ tự động. Khách hàng không phải chỉ định thủ công ánh xạ cho từng tệp mới mà kết quả là MySQL HeatWave Lakehouse sẽ truy vấn
  • Autopilot lấy mẫu một cách thông minh các phần của tệp được lưu trữ trong bộ lưu trữ đối tượng để thu thập số liệu thống kê chính xác với ít quyền truy cập dữ liệu. Các số liệu thống kê này được sử dụng bởi MySQL HeatWave để tạo và nâng cao các kế hoạch truy vấn, chọn ánh xạ lược đồ tốt nhất và những thứ khác
  • Dữ liệu được đưa vào MySQL HeatWave bằng Autopilot, điều này cũng xác định ánh xạ của kiểu dữ liệu và tự động tạo các tập lệnh tải
  • Luồng dữ liệu linh hoạt. MySQL HeatWave Lakehouse thích ứng linh hoạt với chức năng của kho lưu trữ đối tượng cơ bản. Do đó, MySQL HeatWave có thể tận dụng tối đa tiềm năng của cơ sở hạ tầng đám mây cơ bản về hiệu suất, giá cả và tính khả dụng

Các cải tiến bổ sung cho MySQL HeatWave

Các khả năng ML trong cơ sở dữ liệu của MySQL HeatWave đã được làm phong phú thêm để bao gồm hỗ trợ cho các mô hình dự báo trong một số bản cập nhật khác mà Oracle đã công bố, từ học máy đến trình cắm mã VS. Các nhà khoa học dữ liệu hiện có thể tác động đến nhiều giai đoạn khác nhau của quy trình đào tạo HeatWave ML tự động, bao gồm lựa chọn thuật toán, tính năng, số liệu chấm điểm và kỹ thuật giải thích. Ngoài ra, HeatWave ML đã được cải tiến để cho phép người dùng nhập các mô hình ML vào HeatWave

Bản đồ vùng đã được thêm vào, giúp tăng tốc toàn bộ tập hợp truy vấn với MySQL HeatWave và trình tối ưu hóa truy vấn Hypergraph đa công cụ mới đã điều tra thêm về hiệu suất của các truy vấn phức tạp và nghiên cứu nhu cầu chỉ định thứ tự tham gia. Ngoài ra, chức năng MySQL HeatWave hiện được hỗ trợ bởi trình cắm mã VS đã nâng cấp

Sẵn sàng cho Đám mây Phân tán

Đối với các tổ chức không muốn chuyển khối lượng công việc cơ sở dữ liệu của họ sang đám mây công cộng, MySQL HeatWave có sẵn tại chỗ như một phần của Khu vực chuyên dụng OCI và trên nhiều đám mây, bao gồm OCI, AWS và giờ là Microsoft Azure. Để có được các phân tích gần thời gian thực, khách hàng cũng có thể sao chép dữ liệu từ các ứng dụng MySQL OLTP tại chỗ của họ sang MySQL HeatWave, ứng dụng này luôn chạy phiên bản mới nhất của cơ sở dữ liệu MySQL

Oracle hôm nay đã công bố, cho phép khách hàng xử lý và truy vấn hàng trăm terabyte dữ liệu trong kho lưu trữ đối tượng ở nhiều định dạng tệp khác nhau, chẳng hạn như CSV và Parquet, cũng như các bản sao lưu Aurora và Redshift. MySQL HeatWave Lakehouse là phần bổ sung mới nhất cho danh mục MySQL HeatWave, dịch vụ đám mây duy nhất kết hợp xử lý giao dịch, phân tích, học máy và tự động hóa dựa trên học máy trong một cơ sở dữ liệu MySQL duy nhất

Được hỗ trợ bởi kiến ​​trúc MySQL HeatWave mở rộng song song quy mô lớn, MySQL HeatWave Lakehouse mang lại hiệu suất tốt hơn đáng kể so với các dịch vụ cơ sở dữ liệu đám mây cạnh tranh để chạy truy vấn và tải dữ liệu, như được thể hiện qua các điểm chuẩn tiêu chuẩn ngành. Ngoài ra, trong một truy vấn duy nhất, khách hàng có thể truy vấn dữ liệu giao dịch trong cơ sở dữ liệu MySQL và kết hợp nó với dữ liệu trong kho đối tượng bằng cú pháp MySQL tiêu chuẩn. Oracle cũng đã công bố các khả năng MySQL Autopilot mới giúp cải thiện hiệu suất và làm cho MySQL HeatWave Lakehouse dễ sử dụng. MySQL HeatWave Lakehouse hiện đã có ở bản Beta để khách hàng dùng thử và dự kiến ​​sẽ ra mắt rộng rãi trong 1HCY23

Khách hàng di chuyển từ AWS, Google và tại chỗ đã sử dụng MySQL HeatWave cho nhiều trường hợp sử dụng bao gồm phân tích tiếp thị, đặc biệt là phân tích thời gian thực về hiệu suất chiến dịch quảng cáo và phân tích dữ liệu khách hàng để xây dựng chiến dịch hiệu quả. Khách hàng di chuyển từ AWS bao gồm các nhà lãnh đạo trong ngành ô tô, viễn thông, bán lẻ, công nghệ cao và chăm sóc sức khỏe

“MySQL HeatWave là kết quả của nhiều năm nghiên cứu và phát triển nâng cao, chúng tôi đang biến những cải tiến mang tính đột phá để giải quyết một loạt thách thức lớn hơn cho tất cả khách hàng của MySQL. Trên thực tế, MySQL HeatWave Lakehouse là công bố MySQL HeatWave lớn thứ ba của chúng tôi trong năm nay,” Edward Screven, kiến ​​trúc sư trưởng của Oracle cho biết. “Có sự gia tăng lớn về dữ liệu được lưu trữ bên ngoài cơ sở dữ liệu và với MySQL HeatWave Lakehouse, khách hàng có thể tận dụng tất cả lợi ích của HeatWave đối với dữ liệu nằm trong kho lưu trữ đối tượng. MySQL HeatWave hiện cung cấp một dịch vụ tích hợp trên nhiều đám mây để xử lý giao dịch, phân tích trên kho dữ liệu và hồ dữ liệu cũng như học máy mà không cần ETL. Sự kết hợp này giúp mang lại những cải tiến lớn về hiệu suất, tự động hóa và chi phí—giúp MySQL HeatWave vượt xa các dịch vụ cơ sở dữ liệu đám mây khác. ”

Mark Papermaster, giám đốc cho biết: “Chúng tôi rất vui mừng được tiếp tục hợp tác với Oracle, phát triển nó để hỗ trợ sản phẩm MySQL HeatWave Lakehouse mới của họ, được tối ưu hóa để chạy trên các phiên bản đám mây Oracle do AMD EPYC cung cấp và tận dụng những cải tiến mới nhất trong bộ xử lý của chúng tôi”. . “Công việc chung của các nhóm kỹ thuật AMD và Oracle đã giúp tạo ra một giải pháp MySQL ấn tượng có thể hỗ trợ khả năng mở rộng và hiệu suất tuyệt vời để xử lý giao dịch, phân tích, học máy và tự động hóa dựa trên học máy trong một cơ sở dữ liệu MySQL duy nhất. ”

Oracle cũng đang công bố các điểm chuẩn mới của lakehouse và giới thiệu một số khả năng sáng tạo cho MySQL HeatWave Lakehouse và MySQL Autopilot

 

điểm chuẩn

  • Nhanh hơn Snowflake và Amazon Redshift cả về hiệu suất truy vấn và tải dữ liệu

    Như được minh họa bằng điểm chuẩn 400 TB TPC-H* hoàn toàn minh bạch, công khai, hiệu suất truy vấn của MySQL HeatWave Lakehouse là

    • Nhanh hơn 17 lần so với Snowflake
    • Nhanh hơn 6 lần so với Amazon Redshift

    Tải dữ liệu từ kho lưu trữ đối tượng vào MySQL HeatWave Lakehouse cũng nhanh hơn đáng kể. Đối với khối lượng công việc 400 TB TPC-H*, hiệu suất tải của MySQL HeatWave Lakehouse là
    • Nhanh hơn 8 lần so với Amazon Redshift
    • 2. Nhanh hơn 7 lần so với Snowflake

    Tất cả các tập lệnh điểm chuẩn hoàn toàn minh bạch này đều có sẵn trên GitHub để khách hàng sao chép

Ron Westfall, nhà phân tích cấp cao và giám đốc nghiên cứu của Futurum Research cho biết: “MySQL HeatWave Lakehouse đốt cháy cuộc cạnh tranh bằng cách đốt cháy con đường dẫn đến lãnh thổ chưa được khám phá trước đây của các điểm chuẩn cơ sở dữ liệu đám mây 400 TB với tốc độ chóng mặt. “MySQL HeatWave Lakehouse là một bước nhảy vọt cho HeatWave về khả năng xử lý và sức mạnh tính toán. từ 32TB và 64 nút đến 400 TB và 512 nút với hiệu suất và hiệu suất giá dễ dàng đánh bại Amazon Redshift và Snowflake. Trong khi đó, các đối thủ cạnh tranh về cơ sở dữ liệu đám mây vẫn chưa đáp ứng được sự hội tụ trong cơ sở dữ liệu và sự hiện diện trên nhiều đám mây của MySQL HeatWave. Làm thế nào họ sẽ đối phó với 400 TB MySQL HeatWave Lakehouse?”

 

Các khả năng mới sáng tạo dành cho MySQL HeatWave Lakehouse

  • Kích thước dữ liệu lớn hơn, cú pháp MySQL tiêu chuẩn. Khách hàng có thể truy vấn tới 400 TB dữ liệu với MySQL HeatWave Lakehouse và cụm HeatWave chia tỷ lệ thành 512 nút. Khách hàng sử dụng cú pháp MySQL tiêu chuẩn để truy vấn dữ liệu
  • Hiệu suất và nén giống hệt nhau. MySQL HeatWave cung cấp hiệu suất truy vấn giống nhau cho dữ liệu được lưu trữ bên trong cơ sở dữ liệu MySQL hoặc trên kho lưu trữ đối tượng—như được thể hiện qua cả điểm chuẩn TPC-H 10TB và 30TB. Hơn nữa, lượng nén đạt được và lượng dữ liệu có thể được xử lý trên mỗi nút là như nhau trong cả hai trường hợp
  • Hỗ trợ nhiều định dạng tập tin. Với MySQL HeatWave Lakehouse, khách hàng có thể tải và xử lý dữ liệu được lưu trữ ở nhiều định dạng tệp khác nhau, chẳng hạn như CSV và Parquet, cũng như các bản sao lưu Aurora và Redshift từ AWS. Điều này cho phép khách hàng tận dụng các lợi ích của MySQL HeatWave ngay cả khi dữ liệu của họ không được lưu trữ bên trong cơ sở dữ liệu MySQL. Hiệu suất truy vấn là như nhau bất kể định dạng tệp mà dữ liệu được lưu trữ
  • Khả năng truy vấn dữ liệu trong MySQL và kết hợp nó với dữ liệu trong kho đối tượng. Với MySQL HeatWave Lakehouse, khách hàng có thể truy vấn dữ liệu OLTP của họ được lưu trữ bên trong cơ sở dữ liệu MySQL và kết hợp nó với dữ liệu được lưu trữ trong kho đối tượng. Mọi thay đổi đối với dữ liệu OLTP đều được cập nhật theo thời gian thực và được phản ánh trong kết quả truy vấn
 

Khả năng MySQL Autopilot mới cho MySQL HeatWave Lakehouse

MySQL Autopilot cung cấp tính năng tự động hóa dựa trên máy học cho MySQL HeatWave. Các khả năng MySQL Autopilot hiện có chẳng hạn như và đã được tăng cường cho MySQL HeatWave Lakehouse, giúp giảm thêm chi phí quản trị cơ sở dữ liệu và cải thiện hiệu suất. Ngoài ra, một số khả năng MySQL Autopilot mới hiện có sẵn cho MySQL HeatWave Lakehouse

  • Tự động suy luận giản đồ. Autopilot tự động phỏng đoán ánh xạ của dữ liệu tệp tới các kiểu dữ liệu trong cơ sở dữ liệu. Do đó, khách hàng không cần chỉ định thủ công ánh xạ cho từng tệp mới được truy vấn bởi MySQL HeatWave Lakehouse—do đó tiết kiệm thời gian và công sức
  • lấy mẫu dữ liệu thích ứng. Autopilot lấy mẫu một cách thông minh các phần của tệp trong bộ lưu trữ đối tượng, thu thập số liệu thống kê chính xác với quyền truy cập dữ liệu tối thiểu. MySQL HeatWave sử dụng các số liệu thống kê này để tạo và cải thiện các kế hoạch truy vấn, xác định ánh xạ lược đồ tối ưu và cho các mục đích khác
  • tải tự động. Autopilot phân tích dữ liệu để dự đoán thời gian tải vào MySQL HeatWave, xác định ánh xạ của các kiểu dữ liệu và tự động tạo tập lệnh tải. Người dùng không phải chỉ định thủ công ánh xạ tệp tới lược đồ và bảng cơ sở dữ liệu
  • Luồng dữ liệu thích ứng. MySQL HeatWave Lakehouse tự động thích ứng với hiệu suất của kho lưu trữ đối tượng cơ bản. Do đó, MySQL HeatWave có thể nhận được hiệu suất khả dụng tối đa từ cơ sở hạ tầng đám mây cơ bản giúp cải thiện hiệu suất tổng thể, hiệu suất giá và tính khả dụng
 

Các cải tiến bổ sung cho MySQL HeatWave

Oracle đã công bố một số cải tiến khác đối với MySQL HeatWave trải dài từ học máy đến trình cắm mã VS. Khả năng học máy trong cơ sở dữ liệu của MySQL HeatWave đã được làm phong phú thêm để bao gồm hỗ trợ cho các mô hình dự báo. Các kỹ thuật giải thích học máy mới đã được thêm vào đã được tối ưu hóa cho MySQL HeatWave. Các nhà khoa học dữ liệu hiện có thể tác động đến các giai đoạn khác nhau của quy trình đào tạo HeatWave ML tự động, bao gồm lựa chọn thuật toán, lựa chọn tính năng, số liệu chấm điểm và kỹ thuật giải thích. HeatWave ML cũng đã được cải tiến để cho phép khách hàng nhập các mô hình máy học vào HeatWave

Trình tối ưu hóa truy vấn Siêu đồ thị đa công cụ mới cải thiện hơn nữa hiệu suất của các truy vấn phức tạp và loại bỏ nhu cầu chỉ định thứ tự tham gia. Bản đồ vùng đã được thêm vào, giúp tăng tốc một nhóm truy vấn rộng hơn với MySQL HeatWave. Và plug-in mã VS cho MySQL đã được cải tiến để hỗ trợ khả năng HeatWave của MySQL

 

Sẵn sàng cho Đám mây Phân tán

MySQL HeatWave khả dụng trên nhiều đám mây bao gồm OCI, AWS và giờ là Microsoft Azure. Nó có sẵn tại chỗ như một phần của Khu vực dành riêng cho OCI dành cho các tổ chức không muốn chuyển khối lượng công việc cơ sở dữ liệu của họ sang đám mây công cộng. Khách hàng cũng có thể sao chép dữ liệu từ các ứng dụng MySQL OLTP tại chỗ của họ sang MySQL HeatWave để có được các phân tích gần thời gian thực. MySQL HeatWave luôn có phiên bản mới nhất của cơ sở dữ liệu MySQL

 

Tài nguyên bổ sung

* Truy vấn điểm chuẩn được lấy từ điểm chuẩn TPC, nhưng kết quả không thể so sánh với kết quả điểm chuẩn TPC đã công bố vì chúng không tuân thủ các thông số kỹ thuật của TPC

Oracle MySQL HeatWave là gì?

HeatWave là một trình tăng tốc truy vấn trong bộ nhớ, song song, hiệu suất cao, giúp tăng tốc hiệu suất của MySQL theo các mức độ lớn cho khối lượng công việc phân tích, khối lượng công việc hỗn hợp và máy học

Oracle HeatWave là gì?

Oracle MySQL HeatWave là dịch vụ đám mây MySQL duy nhất có trình tăng tốc truy vấn tích hợp sẵn, hiệu suất cao trong bộ nhớ—HeatWave. Nó tăng hiệu suất của MySQL theo cấp độ lớn cho phân tích và khối lượng công việc hỗn hợp mà không có bất kỳ thay đổi nào đối với các ứng dụng hiện tại .