Các phiên bản được hỗ trợ tính năng này: Frontline Plus; Enterprise Standard và Enterprise Plus; Education Standard và Education Plus; Enterprise Essentials Plus; Cloud Identity Premium. So sánh phiên bản của bạn
Với vai trò quản trị viên, bạn có thể xuất siêu dữ liệu trên Drive của tổ chức sang BigQuery. Dữ liệu về các mục bao gồm siêu dữ liệu liên kết với từng tệp, chẳng hạn như kích thước, nhãn đã áp dụng và người được chia sẻ, nhưng không bao gồm nội dung của tệp. Dữ liệu này cũng bao gồm siêu dữ liệu liên quan đến bộ nhớ dùng chung, chẳng hạn như tên. Bạn có thể xem xét thông tin này để đánh giá xem quyền truy cập vào các tệp nhạy cảm có đáp ứng các mục tiêu về quy định, tuân thủ và bảo mật dữ liệu của tổ chức hay không.
Khi siêu dữ liệu trên Drive của bạn nằm trong BigQuery, bạn có thể tạo Báo cáo tùy chỉnh và Trang tổng quan bằng các công cụ số liệu phân tích như Looker Studio và các đối tác bên thứ ba về trực quan hoá dữ liệu.
Lưu ý:
- Một số bước trên trang này được thực hiện trong bảng điều khiển Cloud vì Google BigQuery là một sản phẩm của Google Cloud.
Bạn phải thiết lập thông tin thanh toán cho dự án trên đám mây của Google vì việc truy vấn và lưu trữ siêu dữ liệu trên Drive trong BigQuery sẽ tốn phí. Để biết thông tin chi tiết, hãy xem thông tin chi tiết về giá của tài khoản thanh toán cho BigQuery. Bạn có thể ước tính chi phí lưu trữ bằng Công cụ tính giá của Google Cloud. Siêu dữ liệu cho 1 triệu tệp sử dụng khoảng 1,5 GB bộ nhớ vật lý trong BigQuery.
Bạn cần có giấy phép được hỗ trợ để thiết lập tính năng xuất báo cáo siêu dữ liệu trên Drive, nhưng báo cáo này bao gồm dữ liệu cho tất cả người dùng.
Siêu dữ liệu trên Drive của bạn được xuất hằng tuần, nhưng bạn có thể chọn xuất hằng ngày. Quá trình xuất sẽ ghi đè lên lần xuất trước. Để giữ lại các lần xuất trước, hãy sử dụng Dịch vụ chuyển dữ liệu của BigQuery để tự động sao chép tập dữ liệu.
Có một khả năng nhỏ là quá trình xuất siêu dữ liệu trên Drive có thể thiếu siêu dữ liệu của tệp đối với một số tệp. Trong một số trường hợp hiếm gặp, một số tệp có thể không được đưa vào.
Bước 1. Thiết lập dự án và tập dữ liệu BigQuery cho siêu dữ liệu trên Drive
- Trong bảng điều khiển Cloud, hãy tạo hoặc mở một dự án BigQuery đang hoạt động.
Để biết thông tin chi tiết, hãy chuyển đến phần Tạo và quản lý dự án. - Bật tính năng thanh toán cho dự án nếu chưa bật.
- Chuyển đến trang IAM cho dự án.
- Cấp cho tài khoản quản trị viên Google Workspace quyền truy cập vào dữ liệu xuất để xử lý và xem dữ liệu. Tìm hiểu thêm về các vai trò và quyền IAM của BigQuery cũng như cách kiểm soát quyền truy cập vào tài nguyên. Đối với mọi tài khoản Google Workspace mà bạn muốn cấp quyền truy cập vào dữ liệu xuất:
- Ở đầu danh sách các thực thể chính, hãy nhấp vào Cấp quyền truy cập.
- Trong phần Thêm thực thể chính, hãy nhập địa chỉ email của tài khoản Google Workspace.
- Nhấp vào vai trò Người chỉnh sửa dữ liệu BigQuery (bigquery.dataEditor). Mẹo: Nhấp vào Bộ lọc rồi nhập BigQuery để tìm các vai trò khác dành riêng cho BigQuery.
- Nhấp vào Lưu.
- Cấp cho bạn và mọi quản trị viên khác sẽ quản lý siêu dữ liệu trên Drive quyền quản trị viên IAM đối với dự án:
- Trên cùng trang IAM, hãy nhấp vào một thực thể chính hiện có hoặc bắt đầu một thực thể chính mới như trong bước trước.
- Nhấp vào vai trò Resource Manager (Trình quản lý tài nguyên) rồi chọn Project IAM Admin (Quản trị viên IAM dự án).
- Nhấp vào Lưu.
- Tìm hoặc tạo một tập dữ liệu BigQuery để lưu trữ siêu dữ liệu trên Drive được xuất.
- Nhấp vào Trình đơn điều hướng
BigQuery.
- Trong bảng Explorer (Trình khám phá) ở bên trái, hãy mở rộng dự án của bạn để liệt kê các tập dữ liệu hiện có.
- Nếu có một tập dữ liệu mà bạn muốn sử dụng, hãy ghi lại mã để sử dụng trong bước tiếp theo.
- Nếu bạn muốn sử dụng một tập dữ liệu mới, hãy chuyển đến phần Tạo tập dữ liệu. Ghi lại tên tập dữ liệu để sử dụng trong bước tiếp theo.
- Nhấp vào Trình đơn điều hướng
Bước 2. Bật và thiết lập tính năng xuất siêu dữ liệu trên Drive
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến Trình đơn
Báo cáo
Tích hợp dữ liệu (hoặc BigQuery Export đối với quản trị viên Education, thao tác này sẽ mở trang Tích hợp dữ liệu).
Bạn phải có đặc quyền của quản trị viên đối với Báo cáo.
- Nhấp vào Xuất dữ liệu về các mục trên Drive.
- Đánh dấu vào hộp Cho phép xuất báo cáo siêu dữ liệu trên Drive sang Google BigQuery để bật tính năng xuất siêu dữ liệu trên Drive.
- Đối với Mã dự án BigQuery, hãy chọn dự án mà bạn muốn lưu trữ siêu dữ liệu trên Drive. Nếu bạn không thấy dự án đó, thì bạn cần thiết lập dự án trong BigQuery. Để biết thông tin chi tiết, hãy chuyển đến phần Hướng dẫn nhanh về cách sử dụng bảng điều khiển Cloud.
- Đối với Tập dữ liệu hiện có trong dự án, hãy nhập tên của tập dữ liệu mà bạn muốn sử dụng để lưu trữ siêu dữ liệu trên Drive trong dự án. Nếu bạn chưa có tập dữ liệu, hãy chuyển đến phần Tạo tập dữ liệu để xem các bước.
- Đối với Lịch xuất, hãy chọn Hằng tuần hoặc Hằng ngày.
- Nhấp vào Lưu. Nếu bạn gặp lỗi không thể lưu, hãy kiểm tra các vấn đề sau trong Google Cloud Console:
- Chuyển đến trang IAM cho dự án của bạn và đảm bảo tài khoản của bạn có vai trò Quản trị viên IAM dự án (resourcemanager.projects.setIamPolicy). Nếu không, hãy cấp vai trò đó cho tài khoản của bạn.
- Chuyển đến phần Khắc phục sự cố về chính sách và kiểm tra xem có chính sách từ chối nào đang chặn quyền truy cập của bạn vào dự án hay không. Để biết thông tin chi tiết, hãy chuyển đến phần Khắc phục sự cố về chính sách.
Sau khi bạn bật tính năng xuất, lần xuất đầu tiên sẽ xuất hiện trong BigQuery sau 1 đến 2 tuần. Sau đó, quá trình xuất sẽ được cập nhật hằng tuần hoặc hằng ngày, tuỳ thuộc vào lựa chọn mà bạn đã chọn trong quá trình thiết lập.
Bước 3. (Không bắt buộc) Cập nhật thời gian hết hạn của dữ liệu
Thời gian hết hạn mặc định cho dữ liệu xuất là 60 ngày, sau đó dữ liệu sẽ bị xoá khỏi Google Cloud.
Để thay đổi thời gian hết hạn, hãy chuyển đến phần Cập nhật thời gian hết hạn mặc định của bảng.
Bước 4. Theo dõi quá trình xuất và thiết lập cảnh báo về lỗi
Các sự kiện xuất siêu dữ liệu trên Drive có trong nhật ký sự kiện của quản trị viên. Trong công cụ điều tra bảo mật, bạn có thể tìm kiếm các sự kiện liên quan đến việc xuất siêu dữ liệu trên Drive và thiết lập cảnh báo.
Các sự kiện liên quan đến việc xuất siêu dữ liệu trên Drive
| Tên sự kiện | Chi tiết |
|---|---|
| Đã hoàn tất quá trình xuất dữ liệu báo cáo về các mục trên Drive | Được ghi lại khi quá trình xuất hoàn tất. |
| Không xuất được dữ liệu báo cáo về các mục trên Drive | Được ghi lại khi quá trình xuất không thành công. Bạn có thể định cấu hình cảnh báo để nhận thông báo khi quá trình xuất không thành công. Để giải quyết vấn đề này, hãy chuyển đến phần Khắc phục sự cố về việc thiếu dữ liệu xuất và thông báo lỗi trên trang này. |
| Đã tạo cấu hình xuất dữ liệu về các mục trên Drive | Được ghi lại khi quản trị viên thiết lập tính năng xuất siêu dữ liệu trên Drive. |
| Đã cập nhật cấu hình xuất dữ liệu về các mục trên Drive | Được ghi lại khi dự án hoặc tập dữ liệu được cập nhật. |
| Đã bắt đầu xoá cấu hình xuất dữ liệu về các mục trên Drive | Được ghi lại khi quản trị viên xoá cấu hình xuất siêu dữ liệu trên Drive trong Bảng điều khiển dành cho quản trị viên. Có thể có độ trễ giữa thời điểm quản trị viên bắt đầu xoá và thời điểm cấu hình thực sự bị xoá. |
Bước 5. Phân tích tập dữ liệu về siêu dữ liệu trên Drive
Bạn có thể phân tích dữ liệu trực tiếp trong BigQuery. Để biết thông tin tổng quan, hãy chuyển đến phần Tổng quan về tính năng phân tích BigQuery | Google Cloud. Để biết thông tin chi tiết, hãy chuyển đến phần Giản đồ và truy vấn mẫu cho siêu dữ liệu trên Drive trong BigQuery.
Khắc phục sự cố về việc thiếu dữ liệu xuất và thông báo lỗi
Nếu bạn không thấy siêu dữ liệu trên Drive trong BigQuery sau khi lưu cấu hình trong Bảng điều khiển dành cho quản trị viên, hãy xem lại các vấn đề sau và cách giải quyết.
| Thông báo lỗi | Cách khắc phục |
|---|---|
| Tập dữ liệu BigQuery này không tồn tại | Nếu tập dữ liệu mà bạn đã chỉ định ban đầu để ghi báo cáo đã bị xoá kể từ thời điểm bạn bật tính năng xuất dữ liệu về các mục trên Drive, thì bạn sẽ nhận được lỗi này. Thay thế mã tập dữ liệu bằng mã của một tập dữ liệu hiện có. |
| Dự án BigQuery này không tồn tại | Nếu dự án BigQuery mà bạn đã chỉ định ban đầu để ghi báo cáo đã bị xoá kể từ thời điểm bạn bật tính năng xuất dữ liệu về các mục trên Drive, thì bạn sẽ nhận được lỗi này. Thiết lập một dự án và tập dữ liệu BigQuery mới để ghi báo cáo. |
| Quyền của tài khoản dịch vụ xuất siêu dữ liệu trên Drive đối với tập dữ liệu BigQuery đã bị xoá | Trong bảng điều khiển Cloud, hãy xác nhận rằng tài khoản dịch vụ có quyền truy cập của người chỉnh sửa đối với tập dữ liệu. |
| Quyền của tài khoản dịch vụ xuất siêu dữ liệu trên Drive đối với dự án BigQuery đã bị xoá | Trong bảng điều khiển Cloud, hãy xác nhận rằng tài khoản dịch vụ có quyền truy cập BigQuery.jobUser đối với dự án. |
| Thiết lập thông tin thanh toán cho dự án của bạn |
Nếu bạn hạ cấp gói thuê bao, thì gói đó có thể không còn hỗ trợ tính năng xuất siêu dữ liệu trên Drive. Trong Bảng điều khiển dành cho quản trị viên, hãy chuyển đến Trình đơn > Thanh toán > Gói thuê bao rồi xác nhận rằng gói thuê bao của bạn là một trong những gói sau: Các phiên bản được hỗ trợ tính năng này: Frontline Plus; Enterprise Standard và Enterprise Plus; Education Standard và Education Plus; Enterprise Essentials Plus; Cloud Identity Premium. So sánh phiên bản của bạn Sau khi bạn chuyển sang một phiên bản hỗ trợ tính năng xuất siêu dữ liệu trên Drive, có thể mất tối đa 2 tuần để xuất báo cáo. Bạn cũng phải thiết lập thông tin thanh toán cho dự án trên đám mây của Google được liên kết với tính năng xuất siêu dữ liệu trên Drive vì việc xuất siêu dữ liệu trên Drive sang BigQuery sẽ tốn phí. Đảm bảo tính năng thanh toán đã được bật cho dự án. |
Các hạn chế đã biết
- Tính năng xuất siêu dữ liệu trên Drive có thể không bao gồm các tệp Jamboard chưa được xác nhận quyền sở hữu hoặc video được tạo bằng Google Vids.
Câu hỏi thường gặp
Việc xuất siêu dữ liệu trên Drive sang BigQuery có tốn phí không?
Có. Chi phí lưu trữ được tính vào dự án BigQuery. Để biết thông tin chi tiết, hãy xem thông tin chi tiết về giá của tài khoản thanh toán cho BigQuery. Bạn có thể ước tính chi phí lưu trữ bằng Công cụ tính giá của Google Cloud. Siêu dữ liệu cho 1 triệu tệp sử dụng khoảng 1,5 GB bộ nhớ vật lý trong BigQuery.
Tính năng xuất siêu dữ liệu trên Drive có thuộc phạm vi điều chỉnh của Điều khoản dịch vụ của Google Workspace không?
Không. Tính năng xuất siêu dữ liệu trên Drive thuộc phạm vi điều chỉnh của Điều khoản dịch vụ của Google Cloud Platform hoặc thoả thuận chi phối việc bạn sử dụng Google Cloud Platform.
Dữ liệu nào được đưa vào siêu dữ liệu trên Drive?
Để biết thông tin chi tiết, hãy xem giản đồ.
Tôi có thể thay đổi mã dự án hoặc tập dữ liệu BigQuery không?
Bạn có thể. Chỉ cần nhớ rằng dữ liệu xuất mới và dữ liệu xuất cuối cùng trước khi thay đổi sẽ ở các vị trí khác nhau.
Tôi có thể xuất sang cùng một dự án BigQuery mà tôi sử dụng để xuất nhật ký dịch vụ sang BigQuery không?
Có. Nếu bạn cũng thiết lập tính năng xuất nhật ký dịch vụ sang BigQuery, thì bạn có thể sử dụng cùng một mã dự án và tập dữ liệu. Siêu dữ liệu trên Drive sẽ chuyển đến một bảng khác trong dự án.
Tôi có thể ngừng xuất siêu dữ liệu trên Drive sang BigQuery không?
Có. Nếu không còn muốn xuất siêu dữ liệu trên Drive sang BigQuery, bạn có thể xoá cấu hình siêu dữ liệu trên Drive trong Bảng điều khiển dành cho quản trị viên.
-
Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến Trình đơn
Báo cáo
Tích hợp dữ liệu (hoặc BigQuery Export đối với quản trị viên Education, thao tác này sẽ mở trang Tích hợp dữ liệu).
Bạn phải có đặc quyền của quản trị viên đối với Báo cáo.
- Nhấp vào Dữ liệu về các mục trên Drive.
- Nhấp vào Mã dự án BigQuery rồi chọn dự án.
- Nhấp vào Xoá.
- Để xác nhận, hãy nhấp lại vào Xoá.
Siêu dữ liệu trên Drive sẽ không còn được xuất. Tập dữ liệu vẫn còn trong dự án với dữ liệu hiện có, nhưng dữ liệu sẽ bị xoá khi hết hạn.
Để khởi động lại tính năng xuất siêu dữ liệu trên Drive, hãy thêm mã dự án.
Tại sao tài khoản dịch vụ được thêm vào dự án và tập dữ liệu BigQuery của tôi?
Bạn có thể thấy một tài khoản dịch vụ có tên là id@gcp-sa-statefulreporting.iam.gserviceaccount.com và một tài khoản dịch vụ khác có tên là drive-inventory-reporting@system.gserviceaccount.com trong danh sách quyền cho dự án và tập dữ liệu BigQuery của bạn. Trong giai đoạn Beta, một tài khoản dịch vụ được dùng để đọc siêu dữ liệu từ Drive và tài khoản còn lại được dùng để ghi dữ liệu kiểm kê Drive vào BigQuery.
Tại sao tôi gặp lỗi tài khoản dịch vụ khi cố gắng thiết lập tính năng xuất siêu dữ liệu trên Drive?
Nếu một chính sách của tổ chức ngăn các tài khoản dịch vụ, id@gcp-sa-statefulreporting.iam.gserviceaccount.com và drive-inventory-reporting@system.gserviceaccount.com, tham gia danh sách quyền, hãy đặt các tài khoản dịch vụ làm trường hợp ngoại lệ. Sử dụng ràng buộc được quản lý iam.managed.allowedPolicyMembers hoặc chính sách tổ chức tuỳ chỉnh tham chiếu đến tài nguyên iam.googleapis.com/AllowPolicy. Để biết thông tin chi tiết, hãy chuyển đến phần Định cấu hình trường hợp ngoại lệ cho tính năng chia sẻ bị hạn chế theo miền.
Tại sao tôi gặp lỗi về quyền khi cố gắng thiết lập tính năng xuất siêu dữ liệu trên Drive?
Bạn phải có quyền xem và quản trị chính sách cho phép đối với dự án để thiết lập tính năng xuất siêu dữ liệu trên Drive. Trong Google Cloud Console, hãy chuyển đến trang IAM và chỉ định vai trò Project IAM Admin (roles/resourcemanager.projectIamAdmin) cho tài khoản quản trị viên Google Workspace của bạn.
Tính năng phân vùng dữ liệu theo khu vực có được hỗ trợ cho tính năng xuất siêu dữ liệu trên Drive không?
Có. Nếu bạn thiết lập chính sách về khu vực lưu trữ dữ liệu trong Bảng điều khiển dành cho quản trị viên, thì dữ liệu của bạn sẽ được xử lý ở khu vực đó. Tuy nhiên, dữ liệu xuất BigQuery của bạn sẽ được ghi vào vùng mà bạn chỉ định khi tạo tập dữ liệu. Để biết thông tin chi tiết, hãy chuyển đến phần Vị trí của BigQuery