Tính năng phân loại bằng AI có thể tự động gắn nhãn nội dung nhạy cảm của tổ chức bạn trong Google Drive bằng các mô hình AI tuỳ chỉnh mà tổ chức bạn huấn luyện mà không cần lập trình. Là quản trị viên, bạn có quyền kiểm soát dữ liệu mà các mô hình của bạn dùng để huấn luyện, vì vậy, mỗi mô hình đều là duy nhất và chỉ có tổ chức của bạn mới có thể sử dụng. Bạn có thể tạo tối đa 5 mô hình phân loại bằng AI riêng biệt cho tổ chức của mình.
Bạn có thể tận dụng các tệp được AI phân loại trong các chính sách bảo mật như quy tắc bảo vệ dữ liệu, Vault, v.v.
Lưu ý: Để được phân loại bằng AI, tệp phải nằm trong bộ nhớ dùng chung hoặc thuộc sở hữu của người dùng có giấy phép hỗ trợ nhãn phân loại.
Tổng quan về hoạt động phân loại bằng AI
Sau đây là các bước cơ bản mà bạn sẽ thực hiện để thiết lập tính năng phân loại bằng AI nhằm tự động gắn nhãn cho các tệp mới và tệp hiện có trên Drive.
1. Tạo mô hình: Trước tiên, bạn chọn hoặc tạo một nhãn phân loại. Mô hình AI sẽ tự động áp dụng nhãn này cho các tệp sau khi được huấn luyện. Bạn cũng tạo nhãn huấn luyện. Nhãn này được dùng để huấn luyện mô hình nhằm xác định nội dung nhạy cảm của tổ chức. Sau đó, bạn tạo một mô hình AI để sử dụng các nhãn này.
2. Huấn luyện mô hình: Sau khi bạn tạo nhãn, người gắn nhãn được chỉ định sẽ phân loại các tệp trên Drive bằng nhãn huấn luyện để tạo tập dữ liệu huấn luyện. Sau đó, mô hình của bạn sẽ sử dụng tập dữ liệu này để tìm hiểu cách phân loại các tệp nhạy cảm.
3. Bật tính năng phân loại bằng AI: Sau khi huấn luyện mô hình, bạn có thể thiết lập tính năng gắn nhãn tự động cho tệp, còn gọi là tính năng tự động áp dụng. Trong quá trình thiết lập, bạn chọn những lựa chọn về nhãn cần bật và những người dùng sở hữu các tệp mà bạn muốn AI phân loại để áp dụng nhãn. Sau đó, mô hình của bạn sẽ bắt đầu tự động gắn nhãn cho các tệp nhạy cảm.
4. Giám sát mô hình: Bạn có thể sử dụng nhật ký sự kiện trên Drive để theo dõi số lượng tệp được phân loại, cũng như số lượng người dùng đã chấp nhận hoặc sửa đổi nhãn được tự động áp dụng (nếu họ có quyền).
Trước khi bắt đầu
- Tìm hiểu cách hoạt động của nhãn phân loại và cách tạo nhãn. Để biết thông tin chi tiết, hãy xem bài viết Bắt đầu sử dụng trong vai trò quản trị viên nhãn phân loại.
- Chọn người gắn nhãn được chỉ định – một nhóm người dùng tại tổ chức của bạn có thể tự gắn nhãn huấn luyện một cách chính xác cho các tệp nhạy cảm.
- Tạo một nhóm cấu hình chỉ dành cho những người gắn nhãn được chỉ định. Để xem hướng dẫn, hãy chuyển đến phần Tuỳ chỉnh các chế độ cài đặt dịch vụ thông qua nhóm cấu hình.
- Bật các đặc quyền sau trong tài khoản quản trị: Quản lý nhãn phân loại, Quản lý quy tắc DLP và Xem quy tắc DLP.
Tạo mô hình
Để tạo mô hình, trước tiên, bạn cần chọn một nhãn phân loại hiện có hoặc tạo một nhãn phân loại mới. Tiếp theo, bạn cần tạo một nhãn huấn luyện phù hợp (tự động (nên dùng) hoặc thủ công bằng trình quản lý nhãn) để những người gắn nhãn được chỉ định sẽ sử dụng.
Chọn hoặc tạo nhãn phân loại
Bạn phải bật tính năng phân loại cho Drive và Tài liệu. Sau khi huấn luyện, mô hình AI sẽ tự động áp dụng nhãn phân loại cho các tệp nhạy cảm trên Drive. Mô hình chỉ được huấn luyện trên một trường cho mỗi nhãn, trường đó phải là danh sách huy hiệu hoặc danh sách lựa chọn.
Bạn nên sử dụng nhãn độ nhạy có huy hiệu vì loại nhãn này sẽ xuất hiện nổi bật trên tài liệu:
Khi bạn sử dụng trường danh sách các lựa chọn hoặc danh sách huy hiệu cho nhãn phân loại, nhãn đó phải:
- Có ít nhất 2 và không quá 7 lựa chọn
- Được xuất bản
Nếu có một nhãn hiện tại đáp ứng các yêu cầu này, bạn có thể sử dụng nhãn đó làm nhãn phân loại. Nếu không, hãy sử dụng trình quản lý nhãn để tạo nhãn, trước hoặc trong khi thiết lập mô hình (sau này trên trang này). Để biết thông tin chi tiết, hãy xem bài viết Tạo nhãn phân loại cho tổ chức của bạn.
Tạo nhãn huấn luyện
Nhãn huấn luyện gần giống với nhãn phân loại và chỉ được những người gắn nhãn được chỉ định sử dụng cho mục đích huấn luyện. Khi tạo mô hình (ở phần sau trên trang này), bạn có thể tự động tạo nhãn huấn luyện để đảm bảo nhãn này khớp với nhãn phân loại.
Bạn cũng có thể chọn tạo nhãn huấn luyện của riêng mình theo cách thủ công bằng trình quản lý nhãn, trước hoặc trong khi thiết lập mô hình. Để biết thông tin chi tiết, hãy xem phần Làm cách nào để tạo nhãn huấn luyện theo cách thủ công? ở phần sau của trang.
Tạo mô hình
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến biểu tượng Trình đơn
Bảo mật
Quyền truy cập và kiểm soát dữ liệu
Phân loại dữ liệu.
Bạn phải có đặc quyền Quản lý nhãn phân loại dành cho quản trị viên.
- Trong mục Phân loại bằng AI, hãy nhấp vào Tạo mô hình.
- Trong danh sách Nhãn phân loại, hãy chọn một nhãn phân loại và trường hiện có để huấn luyện mô hình hoặc nhấp vào Tạo nhãn để tạo nhãn bằng trình quản lý nhãn.
Nếu bạn đã tạo nhãn trong trình quản lý nhãn, hãy quay lại trang Tạo mô hình. Bạn có thể cần phải làm mới trang để xem nhãn mới trong danh sách.
- Đối với nhãn phân loại, hãy chọn trường đủ điều kiện mà bạn muốn sử dụng trong danh sách Tên trường.
- Nhấp vào Tiếp tục.
- (Không bắt buộc) Tự động tạo và xuất bản nhãn huấn luyện trùng khớp với nhãn phân loại của bạn:
- Nhấp vào Tạo nhãn huấn luyện.
- Nhấp vào Cập nhật quyền đối với nhãn trong thông báo xuất hiện. Nhãn sẽ mở ở Chế độ chỉnh sửa trong trình quản lý nhãn ở một thẻ riêng.
- Nhấp vào Quyền
Chỉnh sửa, sau đó cấp quyền Có thể áp dụng nhãn và đặt giá trị cho nhóm cấu hình chứa người gắn nhãn.
- Nhấp vào Lưu rồi đóng thẻ trình quản lý nhãn.
Lưu ý: Bạn cũng có thể đặt quyền đối với nhãn sau này. Tuy nhiên, điều quan trọng là chỉ người gắn nhãn mới có quyền truy cập vào nhãn huấn luyện.
- (Không bắt buộc) Nếu bạn đã tạo nhãn huấn luyện, hãy chọn nhãn đó trong danh sách Nhãn huấn luyện.
- (Không bắt buộc) Tạo nhãn huấn luyện của riêng bạn ngay bây giờ bằng cách nhấp vào Chuyển đến trình quản lý nhãn.
Quan trọng: Đảm bảo nhãn của bạn đáp ứng các tiêu chí của nhãn huấn luyện và bạn thiết lập quyền đối với nhãn để chỉ người gắn nhãn mới có thể truy cập vào nhãn đó. Để biết thông tin chi tiết, hãy xem nguyên tắc về nhãn huấn luyện ở phần sau trên trang này.
Quay lại trang Tạo mô hình. Bạn có thể cần phải làm mới trang để xem nhãn huấn luyện mới trong danh sách.
- Trên trang Tạo mô hình, hãy nhấp vào Tiếp tục.
- Nhập tên mô tả cho mô hình.
- Nhấp vào Tạo mô hình.
Sau khi bạn tạo mô hình, trang Thông tin chi tiết về mô hình sẽ cho thấy nhãn huấn luyện và nhãn phân loại mà bạn đã chọn.
Huấn luyện mô hình
Để huấn luyện mô hình AI, bạn cần tạo một tập dữ liệu huấn luyện rồi bắt đầu chạy quy trình huấn luyện ban đầu. Trong quá trình huấn luyện, mô hình sẽ học hỏi từ các ví dụ trong tập dữ liệu.
Việc huấn luyện lại diễn ra tự động: Sau lượt huấn luyện ban đầu, mô hình của bạn sẽ được huấn luyện lại 2 tuần một lần để giúp cải thiện hoặc duy trì mức độ chính xác. Bạn có thể huấn luyện lại mô hình theo cách thủ công bất cứ lúc nào. Sau mỗi lượt huấn luyện, một mô hình mới sẽ được phát hành và lịch huấn luyện lại tự động 2 tuần sẽ được đặt lại.
Tạo tập dữ liệu huấn luyện
Để tạo tập dữ liệu huấn luyện, những người gắn nhãn được chỉ định cần áp dụng nhãn huấn luyện cho ít nhất 100 tệp đối với mỗi loại nhãn. Ví dụ: Nếu nhãn của bạn có 3 lựa chọn (chẳng hạn như "Cần biết", "Bảo mật" và "Công khai"), thì bạn cần ít nhất 300 tệp huấn luyện. Tuy nhiên, tốt nhất là bạn nên có hơn 100 tệp cho mỗi lựa chọn về nhãn, vì có thể một số tệp sẽ không đủ điều kiện dùng cho tập dữ liệu huấn luyện. Tìm hiểu về cách gắn nhãn các ví dụ chất lượng cao để huấn luyện.
Lưu ý: Tập dữ liệu huấn luyện của bạn có thể có tối đa 1 triệu tệp.
Sau khi bạn tạo mô hình, hệ thống sẽ tự động kiểm tra xem có bao nhiêu tệp đã được gắn nhãn để huấn luyện trong khoảng 24 giờ. Sau đó, hệ thống sẽ liên tục kiểm tra trong suốt cả ngày.
Cách kiểm tra số lượng tệp đã được gắn nhãn:
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến biểu tượng Trình đơn
Bảo mật
Quyền truy cập và kiểm soát dữ liệu
Phân loại dữ liệu.
Bạn phải có đặc quyền Quản lý nhãn phân loại dành cho quản trị viên.
- Trong phần Phân loại bằng AI, hãy nhấp vào Xem nn mô hình.
- Trong mục Thao tác đối với mô hình, hãy chọn Xem chi tiết.
- Trong bảng điều khiển ở đầu trang, trong phần Tệp huấn luyện cho mô hình đang hoạt động, hãy xem số lượng tệp được gắn nhãn.
Nếu mô hình của bạn có đủ tệp để huấn luyện, thì trạng thái sẽ là Sẵn sàng huấn luyện
Bắt đầu một lượt huấn luyện
Một lần chạy huấn luyện thường mất từ 4 đến 6 giờ, nhưng có thể lâu hơn đối với các tập dữ liệu lớn hơn. Mô hình của bạn có thể cần chạy nhiều lượt huấn luyện để học cách gắn nhãn tệp một cách chính xác.
Trong một lượt huấn luyện, mô hình sẽ so sánh phân loại mà mô hình chọn cho một tệp với nhãn huấn luyện được áp dụng cho tệp đó để tạo điểm số. Để biết thông tin chi tiết, hãy xem bài viết Cách tính điểm.
Sau một lượt huấn luyện, bạn có thể kiểm tra độ chính xác của mô hình.
Cách bắt đầu một lượt huấn luyện:
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến biểu tượng Trình đơn
Bảo mật
Quyền truy cập và kiểm soát dữ liệu
Phân loại dữ liệu.
Bạn phải có đặc quyền Quản lý nhãn phân loại dành cho quản trị viên.
- Trong phần Phân loại bằng AI, hãy nhấp vào Xem nn mô hình.
- Trên trang Thông tin chi tiết về mô hình, trong mục Thao tác cho mô hình, hãy chọn Xem chi tiết.
- Trong bảng điều khiển huấn luyện ở đầu trang, hãy nhấp vào Bắt đầu chạy quy trình huấn luyện.
Lưu ý: Nút này chỉ xuất hiện nếu người gắn nhãn đã gắn nhãn cho số lượng tệp huấn luyện tối thiểu.
Sau khi huấn luyện: Kiểm tra điểm số của mô hình
Sau một lượt huấn luyện, mô hình của bạn sẽ được phát hành kèm theo điểm số phần trăm cho từng loại nhãn. Mỗi điểm số (gọi là điểm số thu hồi) là tỷ lệ phần trăm số ví dụ huấn luyện mà mô hình đã phân loại chính xác sau khi tự kiểm tra:
- Dưới 50% – Độ chính xác thấp. Mô hình cần có dữ liệu tốt hơn và chưa sẵn sàng.
- Từ 50 đến 80% – Độ chính xác trung bình. Mô hình này có thể chỉ sẵn sàng ở mức độ hạn chế.
- Trên 80% – Độ chính xác cao. Mô hình đã sẵn sàng phân loại tệp cho tổ chức của bạn.
Cách kiểm tra độ chính xác của mô hình sau một lần huấn luyện:
Trên trang Chi tiết về mô hình, bạn có thể xem điểm số của mô hình:
- Trong bảng kết quả huấn luyện ở đầu trang, trong mục Tệp được sử dụng và điểm số hiện tại
- Trong bảng Tập dữ liệu huấn luyện hiện tại
Bật tính năng phân loại bằng AI
Sau khi mô hình AI được huấn luyện để đạt được mức độ chính xác tối thiểu (ít nhất là 50%), bạn có thể chọn các loại nhãn và bật tính năng tự động gắn nhãn cho tệp hoặc tự động áp dụng. Tuy nhiên, để đạt kết quả tốt nhất, bạn nên đợi cho đến khi điểm số mô hình của tất cả các lựa chọn về nhãn đạt ít nhất 80%.
Cách bật tính năng tự động áp dụng
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến biểu tượng Trình đơn
Bảo mật
Quyền truy cập và kiểm soát dữ liệu
Phân loại dữ liệu.
Bạn phải có đặc quyền Quản lý nhãn phân loại dành cho quản trị viên.
- Trong phần Phân loại bằng AI, hãy nhấp vào Xem nn mô hình.
- Trên trang Thông tin chi tiết về mô hình, trong mục Thao tác cho mô hình, hãy chọn Xem chi tiết.
- Trong bảng huấn luyện, hãy nhấp vào Thiết lập tính năng tự động áp dụng.
Lưu ý: Nút này chỉ xuất hiện nếu có ít nhất 1 lựa chọn nhãn đạt độ chính xác 50%.
Hoặc nếu trước đây bạn đã thiết lập tính năng tự động áp dụng, thì trong mục Tệp có gắn nhãn AI, hãy nhấp vào Chỉnh sửa tính năng tự động áp dụng.
- Đánh dấu vào các hộp cho những lựa chọn về nhãn mà bạn muốn cho phép mô hình AI tự động áp dụng.
- Nhấp vào Lưu và tiếp tục để chọn đơn vị tổ chức hoặc nhóm sở hữu các tệp mà mô hình sẽ tự động áp dụng nhãn. Chế độ cài đặt mặc định là tổ chức mẹ cấp cao nhất.
Hoặc nhấp vào Lưu để chọn người dùng sau.
- Nếu bạn chọn người dùng, hãy chọn một đơn vị tổ chức hoặc nhóm cấu hình ở bên cạnh.
Các chế độ cài đặt nhóm sẽ thay thế đơn vị tổ chức. Tìm hiểu thêm
- Nhấp vào Bật – Tự động áp dụng nhãn theo một trong các loại nhãn bên dưới.
- Nhấp vào Lưu.
Trên trang Chi tiết về mô hình, Trạng thái hiện tại của tính năng tự động áp dụng cho quy tắc là Bật.
Lưu ý: Bạn có thể theo dõi hoạt động phân loại bằng AI bằng cách sử dụng nhật ký sự kiện trên Drive. Để biết thông tin chi tiết, hãy xem phần Theo dõi các sự kiện nhãn phân loại bằng AI ở phần sau trên trang này.
Khi tính năng phân loại bằng AI quét tệp
Sau khi tính năng tự động áp dụng được bật cho các tệp thuộc quyền sở hữu của người dùng và bộ nhớ dùng chung, tính năng phân loại bằng AI sẽ quét các tệp của họ (khi không hoạt động) ít nhất một lần trong vòng 1 đến 2 tuần. Tính năng Phân loại bằng AI cũng quét các tệp bất cứ khi nào chúng được tải lên hoặc sửa đổi, đồng thời có thể thay đổi nhãn đã áp dụng nếu nội dung của tệp thay đổi.
Cách xử lý các xung đột khi tự động áp dụng
Quy tắc bảo vệ dữ liệu
Các giá trị nhãn do quy tắc bảo vệ dữ liệu đặt sẽ được ưu tiên hơn so với tính năng phân loại bằng AI, và cả hai đều được ưu tiên hơn so với tính năng phân loại mặc định.
Nhiều quy tắc
Khi 2 hoặc nhiều quy tắc cùng loại cố gắng áp dụng các lựa chọn nhãn khác nhau cho cùng một tệp, thì lựa chọn có thứ tự cao hơn trong danh sách lựa chọn của nhãn sẽ được áp dụng. Ví dụ: bạn có thể có một nhãn có trường có 3 lựa chọn trong trình quản lý nhãn:
- Tài liệu bí mật
- Nội bộ
- Công khai
Nếu Quy tắc 1 cố gắng đặt nhãn là Bí mật và Quy tắc 2 cố gắng đặt nhãn là Công khai cho cùng một tệp, thì nhãn Bí mật sẽ được áp dụng. Đảm bảo rằng các lựa chọn về trường của nhãn được liệt kê theo thứ tự ưu tiên mà bạn muốn trước khi thiết lập quy tắc.
Nhãn do người dùng áp dụng
Nhãn mà người dùng áp dụng cho tệp sẽ được ưu tiên hơn nhãn do AI áp dụng. Tức là tính năng phân loại bằng AI sẽ không sửa đổi nhãn mà người dùng đã đặt trước đó.
Giám sát mô hình
Xem thông tin chi tiết về cách tính năng phân loại bằng AI gắn nhãn cho các tệp trong nhật ký sự kiện trên Drive. Đối với mỗi loại nhãn, nhật ký sẽ cho biết có bao nhiêu tệp được phân loại bằng tính năng tự động áp dụng và có bao nhiêu người dùng chấp nhận hoặc sửa đổi nhãn được áp dụng tự động. Người dùng cần có quyền để thực hiện các hành động đối với nhãn được áp dụng tự động.
Quyền mà người dùng cần có để tương tác với nhãn được áp dụng tự động
Người dùng cần có quyền đối với tệp và nhãn để tương tác với các nhãn được áp dụng tự động. Bạn có thể đặt quyền cho nhãn phân loại trong trình quản lý nhãn. Để biết thông tin chi tiết, hãy xem bài viết Tạo nhãn phân loại cho tổ chức.
- Để xem nhãn được tự động áp dụng, người dùng cần có quyền Có thể xem nhãn này đối với nhãn phân loại của bạn.
- Để chấp nhận và sửa đổi nhãn được áp dụng tự động, người dùng cần có quyền Có thể áp dụng nhãn và đặt giá trị cho nhãn phân loại của bạn, đồng thời phải là Người chỉnh sửa hoặc Chủ sở hữu của tệp.
Xem các sự kiện phân loại bằng AI trong nhật ký sự kiện của Drive
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến biểu tượng Trình đơn
Bảo mật
Quyền truy cập và kiểm soát dữ liệu
Phân loại dữ liệu.
Bạn phải có đặc quyền Quản lý nhãn phân loại dành cho quản trị viên.
- Trong phần Phân loại bằng AI, hãy nhấp vào Xem nn mô hình.
- Trên trang Chi tiết về mô hình, trong mục Tệp được gắn nhãn bằng AI, hãy chọn Xem tệp cho nhãn mà bạn muốn xem sự kiện.
Công cụ điều tra bảo mật sẽ mở ra trong một thẻ mới, cho thấy kết quả tìm kiếm nhật ký sự kiện trên Drive cho 2 sự kiện liên quan đến việc phân loại bằng AI: Đã áp dụng nhãn và Đã thay đổi giá trị trường nhãn.
- Nhấp vào Nội dung mô tả của sự kiện để xem thêm thông tin chi tiết, chẳng hạn như:
- Tên và loại tài liệu được gắn nhãn
- Giá trị của trường nhãn được chỉ định cho tài liệu (ví dụ: Mật hoặc Bị hạn chế)
Quản lý mô hình
Tắt chế độ tự động áp dụng cho nhãn phân loại
Cách tắt chế độ tự động áp dụng cho tất cả hoặc chỉ những lựa chọn về nhãn cụ thể:
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến biểu tượng Trình đơn
Bảo mật
Quyền truy cập và kiểm soát dữ liệu
Phân loại dữ liệu.
Bạn phải có đặc quyền Quản lý nhãn phân loại dành cho quản trị viên.
- Trong phần Phân loại bằng AI, hãy nhấp vào Xem nn mô hình.
- Trên trang Thông tin chi tiết về mô hình, trong mục Thao tác cho mô hình, hãy chọn Xem chi tiết.
- Trong mục Tệp được gắn nhãn bằng AI, hãy nhấp vào Chỉnh sửa tính năng tự động áp dụng.
- Bỏ chọn các hộp cho những lựa chọn về nhãn mà bạn muốn tắt tính năng tự động áp dụng.
Hoặc để tạm dừng hoàn toàn chế độ tự động áp dụng, hãy bỏ đánh dấu tất cả các lựa chọn.
Cách tắt hoàn toàn tính năng tự động áp dụng cho một số đơn vị tổ chức hoặc nhóm:
Bạn có thể tắt hoàn toàn tính năng tự động áp dụng cho nội dung do người dùng trong các đơn vị tổ chức hoặc nhóm cụ thể sở hữu.
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến biểu tượng Trình đơn
Bảo mật
Quyền truy cập và kiểm soát dữ liệu
Phân loại dữ liệu.
Bạn phải có đặc quyền Quản lý nhãn phân loại dành cho quản trị viên.
- Trong phần Phân loại bằng AI, hãy nhấp vào Xem nn mô hình.
- Trên trang Thông tin chi tiết về mô hình, trong mục Thao tác cho mô hình, hãy chọn Xem chi tiết.
- Trong trình đơn Thao tác khác ở đầu trang, hãy nhấp vào Quản lý tính năng tự động áp dụng
Cập nhật các đơn vị tổ chức/nhóm được bật.
- Nhấp vào một đơn vị tổ chức hoặc nhóm ở bên trái để chọn.
- Chọn Tắt – Nhãn không được áp dụng tự động.
- Nhấp vào Lưu.
Xoá mô hình
Bạn có thể cần xoá một mô hình, chẳng hạn như vì độ chính xác của mô hình không cải thiện. Nếu bạn xoá một mô hình, tất cả chế độ cài đặt phân loại bằng AI của mô hình đó sẽ bị xoá vĩnh viễn. Lưu ý:
- Những nhãn chỉ được dùng trong mô hình này sẽ bị xoá khỏi chế độ cài đặt việc phân loại và tất cả phiên bản của mô hình này sẽ bị xoá.
- Nhãn huấn luyện vẫn sẽ nằm trên các tệp. Sau khi xoá mô hình, bạn có thể chọn định cấu hình một mô hình mới để sử dụng cùng một nhãn huấn luyện (hoặc một nhãn khác).
- Mọi chế độ tự động áp dụng nhãn mà bạn đã bật cho mô hình này sẽ dừng lại ngay lập tức. Tuy nhiên, những nhãn được tự động áp dụng trước đó vẫn sẽ giữ nguyên trên các tệp.
- Kết quả mô hình đưa ra sẽ tương tự nếu bạn đào tạo lại bằng nhãn huấn luyện và tệp huấn luyện hiện có.
- Nếu bạn tạo lại cùng một nhãn phân loại cho một mô hình mới, thì tính năng phân loại bằng AI sẽ bỏ qua và ghi đè các phân loại của các mô hình trước đó. Bằng cách này, bạn có thể "xử lý lại" các tệp trên Drive của tổ chức mình. Điều này có thể hữu ích nếu bạn đã cải thiện đáng kể chất lượng mô hình kể từ lần triển khai ban đầu.
Cách xoá một mô hình:
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến biểu tượng Trình đơn
Bảo mật
Quyền truy cập và kiểm soát dữ liệu
Phân loại dữ liệu.
Bạn phải có đặc quyền Quản lý nhãn phân loại dành cho quản trị viên.
- Trong phần Phân loại bằng AI, hãy nhấp vào Xem nn mô hình.
- Trên trang Thông tin chi tiết về mô hình, trong mục Thao tác cho mô hình, hãy chọn Xem chi tiết.
- Trên trang Chi tiết về mô hình, trong phần Hành động ở bên phải, hãy nhấp vào Xoá mô hình.
Hộp thoại Xoá mô hình liệt kê những ảnh hưởng của việc xoá mô hình.
- Để tiếp tục, hãy nhấp vào Xoá mô hình.
Câu hỏi thường gặp
Nhãn huấn luyện và phân loại
Các yêu cầu đối với nhãn huấn luyện và phân loại là gì?
Cả nhãn phân loại và nhãn huấn luyện đều phải đáp ứng các tiêu chí sau:
- Phải có tối thiểu 2 và tối đa 7 lựa chọn.
- Phải có các lựa chọn theo cùng một thứ tự.
Ví dụ: nếu nhãn phân loại có các lựa chọn theo thứ tự sau:
- Tùy chọn 1
- Tùy chọn 2
- Tùy chọn 3
Bạn không thể sắp xếp các lựa chọn về nhãn đào tạo theo cách sau:
- Tùy chọn 2
- Tùy chọn 1
- Tùy chọn 3
- Phải được xuất bản.
- Có nhãn với các quyền truy cập khác nhau. Nhãn huấn luyện chỉ nên được cung cấp cho những người gắn nhãn được chỉ định có thể huấn luyện mô hình. Nhãn phân loại có thể có phạm vi truy cập rộng hơn.
Làm cách nào để tạo nhãn huấn luyện theo cách thủ công?
- Đảm bảo nhãn đáp ứng các tiêu chí bắt buộc đối với nhãn.
- Xác định nhãn huấn luyện bằng từ "huấn luyện" để người gắn nhãn được chỉ định dễ dàng nhận ra và áp dụng nhãn khi bạn tạo tập dữ liệu huấn luyện.
- Thêm một trường mô tả vào nhãn huấn luyện để giúp người gắn nhãn được chỉ định hiểu rõ hơn về mục đích của nhãn.
- Hãy nhớ đặt quyền đối với nhãn thành chỉ những người gắn nhãn được chỉ định (tức là những người sẽ xác định tệp để huấn luyện mô hình) bằng cách sử dụng nhóm cấu hình mà bạn đã tạo cho người gắn nhãn. Người gắn nhãn cần có quyền Có thể áp dụng nhãn và đặt giá trị. Để biết thông tin chi tiết, hãy xem bài viết Tạo nhãn phân loại cho tổ chức của bạn.
Tôi có thể sử dụng nhãn phân loại làm nhãn huấn luyện không?
Tập dữ liệu huấn luyện
Những tệp nào phù hợp để huấn luyện mô hình?
Để đạt được kết quả tốt nhất trong việc huấn luyện mô hình, hãy yêu cầu người gắn nhãn được chỉ định tuân theo các nguyên tắc sau:
- Đảm bảo mỗi tệp có tối thiểu 500 ký tự.
- Chọn những tệp đại diện cho nội dung mà người dùng tạo, chia sẻ và sử dụng trong tổ chức của bạn.
- Gắn nhãn cho số lượng tệp gần bằng nhau cho mỗi lựa chọn về nhãn, với tối thiểu 100 tệp cho mỗi lựa chọn. Điều này giúp mô hình hiểu rõ dữ liệu của bạn và cải thiện điểm số.
- Thêm nhiều tệp đại diện cho từng loại lựa chọn. Ví dụ: đừng gắn nhãn 100 bản lý lịch là tổng số tệp ví dụ cho cấp độ Tuyệt mật nếu hợp đồng cũng là một loại tệp Tuyệt mật phổ biến trong tổ chức của bạn.
- Chỉ áp dụng nhãn huấn luyện cho những tệp thuộc quyền sở hữu của tổ chức bạn, tức là do người dùng sở hữu trực tiếp hoặc được lưu trữ trong bộ nhớ dùng chung. Tính năng phân loại bằng AI không xử lý các tệp mà người dùng bên ngoài sở hữu hoặc nằm trong bộ nhớ dùng chung bên ngoài.
Mô hình có thể được huấn luyện trên các tệp đã được gắn nhãn trước đó không?
Mô hình có thể huấn luyện trên nhiều ngôn ngữ không?
Điểm được tính như thế nào trong quá trình huấn luyện?
Sau khi huấn luyện một mô hình, tôi có thể "đóng băng" mô hình đó để dừng việc huấn luyện lại tự động không?
Người dùng có thể thay đổi hoặc sửa nhãn và giá trị của trường không?
Tự động áp dụng
Tính năng phân loại bằng AI có thể đánh giá hình ảnh, video và tệp âm thanh không?
Tính năng phân loại bằng AI có chỉ dùng để gắn nhãn nội dung nhạy cảm không?
Tính năng phân loại bằng AI có hoạt động khi bạn bật tính năng mã hoá phía máy khách (CSE) không?
Tính năng phân loại bằng AI sửa đổi nhãn được áp dụng tự động như thế nào và khi nào?
Sau khi bạn bật chế độ tự động áp dụng, tính năng phân loại bằng AI sẽ quét và phân loại tất cả các tệp không hoạt động mà tính năng này có thể trích xuất đủ văn bản. Những tệp này được quét ít nhất một lần.
Tính năng phân loại bằng AI định kỳ xử lý lại các tệp khi nội dung được sửa đổi. Nội dung thay đổi có thể dẫn đến một dự đoán khác cho một tệp. Khi tính năng phân loại bằng AI có cả lựa chọn dự đoán cũ và mới cho một tệp, thì AI sẽ ưu tiên lựa chọn có thứ tự cao hơn trong danh sách lựa chọn. Ví dụ: nếu một trường có 3 lựa chọn được liệt kê trong trình quản lý nhãn:
- Tài liệu bí mật
- Nội bộ
- Công khai
Giả sử tính năng phân loại bằng AI phân loại một tệp là Nội bộ và nội dung thay đổi để mô hình phân loại bằng AI dự đoán là Bí mật. Trong trường hợp này, mức phân loại của tệp sẽ thay đổi thành Bảo mật. Tuy nhiên, nếu mô hình phân loại bằng AI dự đoán là Công khai, thì chế độ phân loại trên tệp vẫn là Nội bộ.
Tính năng phân loại bằng AI không sửa đổi các nhãn và giá trị của trường được áp dụng tự động mà người dùng đã xem xét hoặc sửa đổi.
Nếu mô hình thay đổi, mô hình có tự động đánh giá lại các tệp hiện có không?
Các tệp của bạn sẽ được xử lý bằng mô hình mới nhất khi được tạo hoặc sửa đổi. Các tệp hiện có sẽ không tự động được xử lý lại khi một phiên bản mô hình mới được phát hành. Tuy nhiên, mô hình này có thể định kỳ xử lý lại tất cả các tệp của bạn bằng phiên bản mới nhất, độc lập với các bản cập nhật hoặc quá trình huấn luyện lại mô hình cụ thể.
Phương pháp phân loại bằng AI có được ưu tiên hơn các phương pháp phân loại khác khi có nhiều phương pháp đang hoạt động không?
- Quy tắc DLP không có chế độ ghi đè người dùng
- Phân loại thủ công
- Quy tắc DLP có chế độ ghi đè của người dùng
- Phân loại bằng AI
- Phân loại mặc định
Tính năng phân loại bằng AI có thể áp dụng nhãn cho những loại tệp nào?
- Tính năng phân loại bằng AI sử dụng quy trình xử lý văn bản có thể lập chỉ mục giống như DLP của Drive. Để biết thông tin chi tiết, hãy xem danh sách các loại tệp được quét bằng tính năng NCMDL. Không hỗ trợ tệp âm thanh và video.
- Tệp phải có một lượng văn bản tối thiểu để tính năng phân loại bằng AI có thể áp dụng nhãn. Do đó, một số tệp (chẳng hạn như tài liệu rất ngắn và hình ảnh có ít văn bản) có thể không được phân loại.
Điều gì xảy ra khi bạn tắt một lựa chọn để không tự động áp dụng?
Những tệp mà tính năng phân loại bằng AI đã gắn nhãn trước đó vẫn giữ lại nhãn và giá trị tuỳ chọn đã áp dụng ngay cả sau khi bạn tắt tuỳ chọn này.
Tôi có thể huỷ các nhãn được áp dụng tự động không?
Cấp phép
Tính năng này hoạt động như thế nào đối với người dùng không có giấy phép đủ điều kiện?
Bất kỳ người dùng nào có giấy phép hỗ trợ nhãn phân loại của Drive đều có thể sở hữu các tệp có nhãn huấn luyện. Tuy nhiên, tính năng phân loại bằng AI chỉ gắn nhãn cho những tệp nằm trong bộ nhớ dùng chung hoặc thuộc sở hữu của người dùng có giấy phép hỗ trợ tính năng phân loại bằng AI. Tính năng phân loại bằng AI không xử lý các tệp thuộc sở hữu của những người dùng không có giấy phép được hỗ trợ.
Nếu không có người dùng nào có giấy phép hỗ trợ tính năng phân loại bằng AI, thì tính năng tự động áp dụng sẽ bị tắt và mô hình phân loại sẽ bị xoá. Tuy nhiên, nhãn huấn luyện và nhãn do tính năng phân loại bằng AI áp dụng vẫn sẽ xuất hiện trên các tệp.