Azure machine learning là gì

Trong bài trước, chúng ta đã thảo luận về Học máy. Bây giờ trong bài đăng này, chúng ta sẽ thảo luận chi tiết hơn về các thuật toán và tin tôi đi, đây là một trong những đối tượng quan trọng nhất mà một kỹ sư học máy nên biết.

Những đối tượng này không là gì khác ngoài các thuật toán. Là một nhà khoa học dữ liệu hoặc kỹ sư học máy, những điều quan trọng nhất mà chúng ta nên biết là:

  • Dữ liệu là gì?

  • Kết quả là gì?

  • Bạn cần áp dụng phân tích nào để có được kết quả hoặc dự đoán mong muốn?

Tôi biết điều này khá rõ ràng nhưng hãy để tôi giải thích bằng một ví dụ. Giả sử, chúng tôi có dữ liệu học sinh trong các bài tập nội bộ của một trường trung học và chúng tôi cần dự đoán xem học sinh có thể vượt qua kỳ thi cuối kỳ hay không.

Bây giờ, hãy để tôi cung cấp cho bạn tổng quan ngắn gọn về một số loại thuật toán mà chúng tôi có thể yêu cầu trong Azure Machine Learning. Mặc dù có nhiều kiểu [và kiểu phụ] hơn chúng tôi liệt kê ở đây, chúng tôi sẽ không đi sâu vào vấn đề đó. Vì vậy, hãy bắt đầu.

1] Hai lớp

Chúng tôi sẽ áp dụng thuật toán này khi kết quả dự đoán là có / không hoặc đúng / sai hoặc 1/0. Ví dụ, một học sinh có thể vượt qua vòng chung kết hay không?

2] Phân loại

Đây là một thuật toán khác giúp chúng tôi dự đoán các câu trả lời như Kabaddi hoặc đội cricket mà bạn sẽ cổ vũ, hoặc bạn sẽ bỏ phiếu cho đảng chính trị nào.

3] Hồi quy tuyến tính

Đây là một trong những phương pháp dự đoán phổ biến hơn. Ví dụ, trong một văn phòng, bạn có thể dự đoán mức lương của một kỹ sư tùy thuộc vào mức lương của một vài kỹ sư gần đây nhất. Hoặc, bạn có thể dự đoán phạm vi bán bất động sản bằng cách so sánh giá của các lô tương tự trong khu vực.

4] Phát hiện bất thường

Giống như tên gọi, thuật toán này dành cho khi chúng ta cần tìm các điểm bất thường. Ví dụ, giả sử bạn có một đàn bò. Hầu hết chúng đều có màu trắng, nhưng cũng có một chiếc màu đen. Thuật toán này sẽ giúp bạn phát hiện ra những con bò có màu sắc kỳ lạ.

Tôi hy vọng tất cả các loại thuật toán trên đều rõ ràng. Trong bài tiếp theo, chúng tôi thực sự thực hiện Học Microsoft Azure từng bước, vì vậy đừng lo lắng về điều đó.

Vui lòng cung cấp thông tin đầu vào của bạn.

Azure Machine Learning Studio là gì? Thông tin tổng quan, bảng giá, hướng dẫn sử dụng, reviews và đánh giá tính năng phần mềm Azure Machine Learning Studio. Những phần mềm thay thế Azure Machine Learning Studio dùng trong lĩnh vực AI Platforms Software, ưu nhược điểm và so sánh? Xem thông tin tham khảo dưới đây!

Azure Machine Learning Studio là giải pháp phần mềm Azure Machine Learning Studio Reviews với chức năng và chi phí phù hợp cho các doanh nghiệp từ nhỏ và vừa [SMEs] tới các doanh nghiệp lớn. Phần mềm Azure Machine Learning Studio được đánh giá cao bởi cả người dùng lẫn chuyên gia trong lĩnh vực AI Platforms Software.

   

Phần mềm Azure Machine Learning Studio -
Phân loại AI Platforms Software
Danh mục Azure Machine Learning Studio Reviews
Thị trường
Ngôn ngữ
Hệ điều hành
Download Azure Machine Learning Studio

Avatar Azure Machine Learning Studio

Azure Machine Learning Studio is a GUI-based integrated development environment for constructing and operationalizing Machine Learning workflow on Azure.
  • Azure Machine Learning Studio Reviews
Danh sách những phần mềm chức năng tương tự / phần mềm thay thế Azure Machine Learning Studio
  • Pega Platform [so sánh Pega Platform và Azure Machine Learning Studio]
  • Google Cloud AI Platform [so sánh Google Cloud AI Platformvà Azure Machine Learning Studio]

AutoML trong Azure Machine Learning được sử dụng để tự xây dựng các mô hình học máy như chúng ta đã thảo luận trong bài trước. Ở đó, chúng ta đã thảo luận về AutoML là gì và cách phát triển các mô hình phân loại trong AutoML bằng Azure Machine Learning. Bài viết này sẽ dành riêng cho cuộc thảo luận về việc xây dựng mô hình học máy sử dụng AutoML cho các tác vụ Phân cụm và Chuỗi thời gian.

Trong quá trình học máy Azure hàng loạtchúng tôi đã thảo luận về phân tích hồi quy, phân tích phân loại, phân cụm, hệ thống đề xuất và phát hiện bất thường của chuỗi thời gian bằng cách sử dụng
Azure Máy học cổ điển.

hồi quy

Hãy để chúng tôi tạo ra một New Automated ML run từ Azure Machine Learning Studio. Sau đó, bạn cần chọn tập dữ liệu.

Từ Select dataset, chúng ta có thể chọn một tập dữ liệu cần thiết cho nhiệm vụ hồi quy. Trong bài viết trước, chúng tôi đã tạo một tập dữ liệu mới và trong ví dụ này, chúng tôi sẽ sử dụng tập dữ liệu mở được cung cấp cho
xây dựng mô hình học máy trong AutoML trong Azure Machine Learning.

Khi tùy chọn này được chọn, bạn sẽ thấy các bộ dữ liệu mã nguồn mở hiện có như thể hiện trong hình bên dưới.

Mỗi tập dữ liệu đều có một mô tả để bạn có thể hiểu rõ hơn về tập dữ liệu. Hãy để chúng tôi chọn Mẫu: Tập dữ liệu dữ liệu mô phỏng bán hàng của OJ để xây dựng một mô hình học máy hồi quy.

Sau đó, bạn có thể đăng ký tập dữ liệu như hình dưới đây.

Sau đây là hình của tập dữ liệu mẫu sau khi đăng ký tập dữ liệu.

Sau khi tập dữ liệu được tạo, tiếp theo là tạo thử nghiệm AutoML trong Azure Machine Learning để sử dụng tập dữ liệu đã đăng ký.

Trong cấu hình AutoML này, tên thử nghiệm được nhập và cột Mục tiêu là Doanh thu vì chúng tôi sẽ dự đoán doanh thu bằng cách sử dụng kỹ thuật hồi quy. Như chúng ta đã thảo luận trong phần trước, chúng ta có tùy chọn tạo các máy ảo chuyên dụng để xử lý các quy trình AutoML. Trong AutoML, nhiều mô hình sẽ được thực thi. Do đó, bạn cần các máy ảo chuyên dụng, đây là một lợi thế chính của việc sử dụng Dịch vụ Học máy của Azure.

Tiếp theo là chọn loại tác vụ là Regression như hình bên dưới.

Khi mô hình hồi quy cho AutoML trong Azure Machine Learning được tạo, nhiệm vụ tiếp theo là đặt các cấu hình bổ sung cho mô hình AutoML hồi quy.

Trong cấu hình bổ sung này, bạn có thể xác định chỉ số chính là gì. Lỗi bình phương gốc trung bình được chuẩn hóa,Tương quan Spearman, điểm R2 và lỗi tuyệt đối trung bình được chuẩn hóa là các tùy chọn cho AutoML hồi quy trong Azure

Học máy.

Nếu bạn không muốn chạy một số thuật toán, bạn có thể chọn chúng để các thuật toán đó không được thực thi cho các thuật toán đó. Tùy chọn này có thể được sử dụng nếu bạn muốn dừng một số thuật toán do hiệu suất hoặc bất kỳ vấn đề nào khác.

Vì các thuật toán này có thể mất một chút thời gian để thực thi vì Học máy cần một khối lượng lớn tập dữ liệu,
do đó, chúng ta cần đặt tiêu chí thoát. Ví dụ: chúng ta có thể đặt rằng nếu thuật toán đang chạy trong hơn 3 giờ, việc thực thi sẽ dừng lại. Hơn nữa, chúng tôi có thể xác định điểm số liệu làm tiêu chí thoát.

Khi AutoML trong Azure Machine Learning được xử lý, bạn sẽ nhận được các mô hình khác nhau như được hiển thị trong phần sau
nhân vật.

Như bạn thấy trong hình trên, mô hình tốt nhất nằm ở đầu danh sách và bạn có thể xem các thông số đánh giá cho mô hình đã chọn như hình bên dưới.

Sau đó, bạn có thể xuất bản mô hình trực tiếp để nó có thể được sử dụng.

Chuỗi thời gian

Dự báo chuỗi thời gian là một trong những kỹ thuật máy học phức tạp nhất do có nhiều thành phần liên quan đến Chuỗi thời gian. Để chứng minh Chuỗi thời gian cho AutoML trong Azure Machine Learning, chúng ta hãy sử dụng tập dữ liệu Hệ thống Dự báo Toàn cầu [GFS] của NOAA, là một tập dữ liệu mở khác.

Tập dữ liệu này có thêm tính năng lọc phạm vi ngày như hình dưới đây.

Bằng cách sử dụng bộ lọc trên, chúng ta có thể thu hẹp tập dữ liệu cho kịch bản đã chọn. Tùy thuộc vào tập dữ liệu, có thể có các bộ lọc khác nhau. Ví dụ: tập dữ liệu Ngày lễ có bộ lọc cho phạm vi dữ liệu cũng như bộ lọc cho quốc gia, để bạn có thể chọn dữ liệu cho một phạm vi ngày cụ thể cũng như cho một quốc gia cụ thể.

Sau khi tập dữ liệu được chọn, bạn có thể định cấu hình Chuỗi thời gian cho AutoML trong dịch vụ Azure Machine Learning như
được hiển thị trong hình dưới đây.

Trong cấu hình này, chúng ta phải chọn cột mục tiêu là nhiệt độ mà chúng ta sẽ dự báo bằng tác vụ Chuỗi thời gian. Như chúng ta đã thảo luận trước đây, chúng ta có thể chọn phần cứng chuyên dụng cho quá trình Máy học. Chúng tôi có thể mở rộng hoặc giảm tải máy ảo, tùy thuộc vào yêu cầu và tập dữ liệu.

Sau khi chọn Chuỗi thời gian làm nhiệm vụ mà chúng tôi sẽ xử lý AutoML trong Azure Machine Learning, chúng tôi cần
để chỉ ra các thông số bổ sung cho Chuỗi thời gian.

Vì cột thời gian là một yếu tố quan trọng trong phân tích Chuỗi thời gian, chúng tôi cần cung cấp cột Thời gian và nếu có các số nhận dạng như khu vực, quốc gia, chúng tôi cũng cần cung cấp thông tin đó. Tần suất giải thích tần suất cho Cột thời gian có thể được tự động phát hiện hoặc bạn có thể cung cấp tần suất mà bạn muốn chuỗi thời gian được xử lý.

Sau khi cấu hình ở trên, chúng tôi cần cung cấp cài đặt cấu hình bổ sung như chúng tôi đã làm để phân loại và
các nhiệm vụ hồi quy.

Trước tiên, chúng ta cần quyết định đâu là chỉ số chính để quyết định mô hình tốt nhất trong Chuỗi thời gian. Trong ví dụ trên,
Lỗi bình phương trung bình gốc được chuẩn hóa là số liệu chính. Tương tự, chúng ta có thể chọn các thuật toán mà chúng ta không cần phải thực thi AutoML trong Azure Machine Learning.

Một số tham số tiếp theo dành riêng cho Nhiệm vụ chuỗi thời gian. Forecast target lags có thể được đặt thành
tự động phát hiện cũng như cửa sổ cho độ trễ.

Mùa và Xu hướng là một cấu hình quan trọng trong Chuỗi thời gian vì dự báo không chỉ phụ thuộc vào xu hướng mà còn phụ thuộc vào mùa. Chuỗi thời gian phụ thuộc vào Ngày lễ và bạn có thể chọn danh sách ngày nghỉ tùy thuộc vào quốc gia thuộc tập dữ liệu. Đây là một tính năng độc đáo trong AutoML trong Azure Machine learning mà sẽ không có trong nhiều công cụ khác.

Như chúng ta đã làm trong các tác vụ trước, chúng ta có thể đặt Tiêu chí thoát để quá trình đó sẽ không thực thi trong nhiều giờ. Chúng ta có thể đặt thời lượng tối đa để thực thi hoặc giá trị của tham số ma trận chính.

Giống như chúng ta đã làm đối với các nhiệm vụ phân loại và hồi quy, mô hình tốt nhất có thể được chọn và triển khai mô hình.

Sự kết luận

Bài viết này đã mở rộng thảo luận về AutoML trong Azure Machine Learning cho Chuỗi thời gian và hồi quy. Các tác vụ này có cùng nguyên tắc cung cấp tập dữ liệu và với số lượng cấu hình tối thiểu, bạn có thể có được mô hình tốt nhất và triển khai nó. Mô hình tốt nhất sẽ được chọn tùy thuộc vào chỉ số chính đã được định cấu hình. Nhiệm vụ Chuỗi thời gian có tùy chọn kết hợp các lịch ngày lễ khác nhau vì các ngày lễ phụ thuộc vào dự báo Chuỗi thời gian.

Hơn nữa, bài viết này cũng khám phá cách đăng ký bộ dữ liệu mã nguồn mở với các bộ lọc khác nhau.

Mục lục

Video liên quan

Chủ Đề