Xuất dữ liệu về các mục trên Drive của tổ chức

Các phiên bản hỗ trợ tính năng này: Frontline Plus; Enterprise Standard và Enterprise Plus; Education Standard và Education Plus; Enterprise Essentials Plus; Cloud Identity Premium. So sánh phiên bản của bạn

Là quản trị viên, bạn có thể xuất dữ liệu về các mục trên Google Drive của tổ chức sang BigQuery. Kho nội dung bao gồm siêu dữ liệu liên kết với từng tệp, chẳng hạn như kích thước, nhãn đã áp dụng và người được chia sẻ, nhưng không bao gồm nội dung của tệp. Bạn có thể xem xét thông tin này để đánh giá xem quyền truy cập vào các tệp nhạy cảm có đáp ứng các mục tiêu về quy định, việc tuân thủ và bảo mật dữ liệu của tổ chức bạn hay không.

Khi kho lưu trữ trên Drive có trong BigQuery, bạn có thể tạo báo cáo và trang tổng quan tuỳ chỉnh bằng các công cụ phân tích như Looker Studio và các đối tác bên thứ ba về trực quan hoá dữ liệu.

Lưu ý:

  • Một số bước trên trang này được thực hiện trong bảng điều khiển Google Cloud vì Google BigQuery là một sản phẩm của Google Cloud.
  • Bạn phải thiết lập thông tin thanh toán cho dự án Google Cloud vì việc truy vấn và lưu trữ dữ liệu xuất về các mục trên Drive trong BigQuery sẽ tốn phí. Để biết thông tin chi tiết, hãy xem thông tin chi tiết về giá của BigQuery trong tài khoản thanh toán. Bạn có thể ước tính chi phí lưu trữ bằng Công cụ tính mức giá của Google Cloud. Siêu dữ liệu cho 1 triệu tệp sử dụng khoảng 1,5 GB bộ nhớ vật lý trong BigQuery.
  • Bạn cần có giấy phép được hỗ trợ để thiết lập tính năng xuất báo cáo kho lưu trữ trên Drive, nhưng báo cáo này bao gồm dữ liệu của tất cả người dùng.
  • Kho lưu trữ trên Drive được xuất hằng tuần, nhưng bạn có thể chọn xuất hằng ngày. Dữ liệu xuất sẽ ghi đè dữ liệu xuất trước đó. Để giữ lại các dữ liệu xuất trước đó, hãy sử dụng Dịch vụ chuyển dữ liệu của BigQuery để tự động sao chép tập dữ liệu.
  • Có một khả năng nhỏ là tệp xuất kho Drive có thể thiếu siêu dữ liệu tệp của một số tệp. Trong một số ít trường hợp, một số tệp có thể không được đưa vào.

Bước 1. Thiết lập một dự án và tập dữ liệu BigQuery cho kho lưu trữ trên Drive

  1. Trong Bảng điều khiển Google Cloud, hãy tạo hoặc mở một dự án BigQuery đang hoạt động.
    Để biết thông tin chi tiết, hãy xem bài viết Tạo và quản lý dự án.
  2. Bật tính năng thanh toán cho dự án nếu bạn chưa bật.
  3. Chuyển đến trang IAM cho dự án.
  4. Cấp cho tài khoản quản trị viên Google Workspace quyền truy cập vào dữ liệu xuất để xử lý và xem. Tìm hiểu thêm về các quyền và vai trò IAM trong BigQuery cũng như cách kiểm soát quyền truy cập vào tài nguyên. Đối với mọi tài khoản Google Workspace mà bạn muốn cấp quyền truy cập vào dữ liệu xuất:
    1. Ở đầu danh sách các chủ thể, hãy nhấp vào Cấp quyền truy cập.
    2. Trong phần Thêm người dùng, hãy nhập địa chỉ email của tài khoản Google Workspace.
    3. Nhấp vào vai trò Người chỉnh sửa dữ liệu BigQuery (bigquery.dataEditor). Lưu ý: Nhấp vào Lọc rồi nhập BigQuery để tìm các vai trò khác dành riêng cho BigQuery.
    4. Nhấp vào Lưu.
  5. Cấp cho bản thân và mọi quản trị viên khác sẽ quản lý hoạt động xuất kho hàng trên Drive quyền quản trị viên IAM đối với dự án:
    1. Trên cùng trang IAM, hãy nhấp vào một thực thể hiện có hoặc bắt đầu một thực thể mới như trong bước trước.
    2. Nhấp vào vai trò Resource Manager (Trình quản lý tài nguyên) rồi chọn Project IAM Admin (Quản trị viên IAM dự án).
    3. Nhấp vào Lưu.
  6. Tìm hoặc tạo một tập dữ liệu BigQuery để lưu trữ dữ liệu xuất về các mục trên Drive.
    1. Nhấp vào Trình đơn điều hướng sau đóBigQuery.
    2. Trong bảng Explorer (Trình khám phá) ở bên trái, hãy mở rộng dự án của bạn để liệt kê các tập dữ liệu hiện có.
    3. Nếu có một tập dữ liệu mà bạn muốn sử dụng, hãy ghi lại mã nhận dạng để sử dụng trong bước tiếp theo.
    4. Nếu bạn muốn sử dụng một tập dữ liệu mới, hãy xem phần Tạo tập dữ liệu. Ghi lại tên tập dữ liệu để sử dụng trong bước tiếp theo.

Bước 2. Bật và thiết lập tính năng xuất dữ liệu về các mục trên Drive

  1. Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến phần Trình đơn sau đó Báo cáo sau đóTích hợp dữ liệu (hoặc Xuất dữ liệu BigQuery đối với quản trị viên của Education, thao tác này sẽ mở trang Tích hợp dữ liệu).

    Bạn phải có đặc quyền của quản trị viên đối với Báo cáo.

  2. Nhấp vào Xuất siêu dữ liệu trên Drive.
  3. Đánh dấu vào ô Cho phép xuất báo cáo dữ liệu trên Drive sang Google BigQuery để bật tính năng xuất dữ liệu trên Drive.
  4. Đối với Mã dự án BigQuery, hãy chọn dự án mà bạn muốn lưu trữ dữ liệu xuất kho của Drive. Nếu không thấy dự án này, bạn cần thiết lập dự án trong BigQuery. Để biết thông tin chi tiết, hãy xem bài viết Hướng dẫn nhanh khi sử dụng bảng điều khiển Google Cloud.
  5. Đối với Tập dữ liệu hiện có trong dự án, hãy nhập tên của tập dữ liệu mà bạn muốn dùng để lưu trữ kho hàng trên Drive trong dự án. Nếu bạn chưa có tập dữ liệu, hãy xem các bước trong phần Tạo tập dữ liệu.
  6. Đối với Lịch xuất, hãy chọn Hàng tuần hoặc Hàng ngày.
  7. Nhấp vào Lưu. Nếu bạn gặp lỗi không lưu được, hãy kiểm tra các vấn đề sau trong Google Cloud Console:
    1. Chuyển đến trang IAM cho dự án của bạn và đảm bảo tài khoản của bạn có vai trò Quản trị viên IAM dự án (resourcemanager.projects.setIamPolicy). Nếu không, hãy cấp vai trò đó cho tài khoản của bạn.
    2. Chuyển đến Trình khắc phục sự cố về chính sách và kiểm tra xem có chính sách từ chối nào đang chặn quyền truy cập của bạn vào dự án hay không. Để biết thông tin chi tiết, hãy xem bài viết Khắc phục sự cố về chính sách.

Sau khi bạn bật tính năng xuất dữ liệu, lần xuất đầu tiên sẽ xuất hiện trong BigQuery sau 1 đến 2 tuần. Sau đó, báo cáo xuất sẽ được cập nhật hằng tuần hoặc hằng ngày, tuỳ thuộc vào lựa chọn mà bạn đã chọn trong quá trình thiết lập.

Bước 3. (Không bắt buộc) Cập nhật thời gian hết hạn của dữ liệu

Thời gian hết hạn mặc định cho các bản xuất dữ liệu là 60 ngày. Sau khoảng thời gian này, dữ liệu sẽ bị xoá khỏi Google Cloud.

Để thay đổi thời gian hết hạn, hãy xem phần Cập nhật thời gian hết hạn mặc định của bảng.

Bước 4. Theo dõi hoạt động xuất và thiết lập cảnh báo cho các trường hợp thất bại

Các sự kiện xuất siêu dữ liệu trên Drive có trong Nhật ký sự kiện của quản trị viên. Trong công cụ điều tra bảo mật, bạn có thể tìm kiếm các sự kiện liên quan đến việc xuất siêu dữ liệu trên Drive và thiết lập cảnh báo.

Tên sự kiện Thông tin chi tiết
Đã xuất xong báo cáo về siêu dữ liệu trên Drive Được ghi lại khi quá trình xuất hoàn tất.
Không xuất được báo cáo về siêu dữ liệu trên Drive Được ghi lại khi quá trình xuất không thành công. Bạn có thể thiết lập cảnh báo để nhận thông báo khi quá trình xuất không thành công. Để giải quyết, hãy xem phần Khắc phục vấn đề thiếu dữ liệu xuất và thông báo lỗi trên trang này.
Đã tạo cấu hình xuất dữ liệu về các mục trên Drive Được ghi lại khi quản trị viên thiết lập tính năng xuất dữ liệu về các mục trên Drive.
Đã cập nhật cấu hình xuất dữ liệu về các mục trên Drive Được ghi lại khi dự án hoặc tập dữ liệu được cập nhật.
Đã bắt đầu xoá cấu hình xuất dữ liệu về các mục trên Drive Được ghi lại khi quản trị viên xoá một cấu hình xuất dữ liệu về các mục trên Drive trong Bảng điều khiển dành cho quản trị viên. Có thể có độ trễ giữa thời điểm quản trị viên bắt đầu xoá và thời điểm cấu hình thực sự bị xoá.

Bước 5. Phân tích các tập dữ liệu về thông tin trên Drive

Bạn có thể phân tích dữ liệu của mình ngay trong BigQuery. Để xem thông tin tổng quan, hãy truy cập vào Tổng quan về hoạt động phân tích BigQuery | Google Cloud. Để biết thông tin chi tiết, hãy xem bài viết Giản đồ và các truy vấn mẫu để xuất dữ liệu về các mục trên Drive trong BigQuery.

Khắc phục vấn đề thiếu dữ liệu xuất và thông báo lỗi

Nếu bạn không thấy dữ liệu xuất về kho lưu trữ trên Drive trong BigQuery sau khi lưu cấu hình trong bảng điều khiển dành cho quản trị viên, hãy xem xét các vấn đề sau và cách giải quyết.

Thông báo lỗi Cách khắc phục
Tập dữ liệu BigQuery này không tồn tại Nếu bộ dữ liệu mà bạn đã chỉ định ban đầu để báo cáo được ghi vào đã bị xoá kể từ thời điểm bạn bật tính năng xuất Kho hàng trên Drive, thì bạn sẽ nhận được lỗi này. Thay thế mã nhận dạng tập dữ liệu bằng mã nhận dạng của một tập dữ liệu hiện có.
Dự án BigQuery này không tồn tại Nếu dự án BigQuery mà bạn đã chỉ định ban đầu để ghi báo cáo đã bị xoá kể từ khi bạn bật tính năng xuất dữ liệu về các mục trên Drive, thì bạn sẽ nhận được lỗi này. Thiết lập một dự án và tập dữ liệu BigQuery mới để ghi báo cáo vào.
Quyền của tài khoản dịch vụ xuất dữ liệu về các mục trên Drive đối với tập dữ liệu BigQuery đã bị xoá Trong Google Cloud Console, hãy xác nhận rằng tài khoản dịch vụ có quyền truy cập Chỉnh sửa đối với tập dữ liệu.
Quyền của tài khoản dịch vụ xuất dữ liệu về các mục trên Drive đối với dự án BigQuery đã bị xoá Trong bảng điều khiển Google Cloud, hãy xác nhận rằng tài khoản dịch vụ có quyền truy cập BigQuery.jobUser đối với dự án.
Thiết lập thông tin thanh toán cho dự án của bạn

Nếu bạn hạ cấp gói thuê bao, thì gói đó có thể không còn hỗ trợ tính năng xuất dữ liệu về các mục trên Drive. Trong Bảng điều khiển dành cho quản trị viên, hãy chuyển đến phần Trình đơn > Thanh toán > Gói thuê bao rồi xác nhận rằng gói thuê bao của bạn là một trong những gói sau:

Các phiên bản hỗ trợ tính năng này: Frontline Plus; Enterprise Standard và Enterprise Plus; Education Standard và Education Plus; Enterprise Essentials Plus; Cloud Identity Premium. So sánh phiên bản của bạn

Sau khi bạn chuyển sang một phiên bản hỗ trợ tính năng xuất kho trên Drive, có thể mất đến 2 tuần thì báo cáo mới được xuất.

Bạn cũng phải thiết lập thông tin thanh toán cho dự án Google Cloud được liên kết với tính năng xuất dữ liệu trên Drive vì việc xuất dữ liệu trên Drive sang BigQuery sẽ mất phí. Đảm bảo rằng bạn đã bật tính năng thanh toán cho dự án.

Các hạn chế đã biết

  • Tệp xuất thông tin về nội dung trên Drive có thể không bao gồm các tệp Jamboard chưa được xác nhận quyền sở hữu hoặc video được tạo bằng Google Vids.

Câu hỏi thường gặp

Có mất phí khi xuất dữ liệu về các mục trên Drive sang BigQuery không?

Có. Chi phí lưu trữ được tính vào dự án BigQuery. Để biết thông tin chi tiết, hãy xem thông tin chi tiết về giá của BigQuery trong tài khoản thanh toán. Bạn có thể ước tính chi phí lưu trữ bằng Công cụ tính mức giá của Google Cloud. Siêu dữ liệu cho 1 triệu tệp sử dụng khoảng 1,5 GB bộ nhớ vật lý trong BigQuery.

Tính năng xuất dữ liệu về các mục trên Drive có thuộc phạm vi điều chỉnh của Điều khoản dịch vụ của Google Workspace không?

Không. Tính năng xuất dữ liệu về các mục trên Drive thuộc phạm vi điều chỉnh của Điều khoản dịch vụ của Google Cloud Platform hoặc thoả thuận chi phối việc bạn sử dụng Google Cloud Platform.

Dữ liệu nào có trong tệp xuất kho hàng trên Drive?

Để biết thông tin chi tiết, hãy xem giản đồ.

Tôi có thể thay đổi mã dự án hoặc tập dữ liệu BigQuery không?

Bạn có thể. Hãy nhớ rằng các tệp xuất mới và tệp xuất cuối cùng trước khi thay đổi sẽ nằm ở các vị trí khác nhau.

Tôi có thể xuất sang cùng một dự án BigQuery mà tôi dùng để xuất nhật ký dịch vụ sang BigQuery không?

Có. Nếu cũng thiết lập tính năng xuất nhật ký dịch vụ sang BigQuery, bạn có thể sử dụng cùng một mã dự án và tập dữ liệu. Kho lưu trữ trên Drive của bạn sẽ chuyển sang một bảng khác trong dự án.

Tôi có thể ngừng xuất dữ liệu về các mục trên Drive sang BigQuery không?

Có. Nếu không muốn xuất dữ liệu về các mục trên Drive sang BigQuery nữa, bạn có thể xoá cấu hình Dữ liệu về các mục trên Drive trong Bảng điều khiển dành cho quản trị viên.

  1. Trong Bảng điều khiển dành cho quản trị viên của Google, hãy chuyển đến phần Trình đơn sau đó Báo cáo sau đóTích hợp dữ liệu (hoặc Xuất dữ liệu BigQuery đối với quản trị viên của Education, thao tác này sẽ mở trang Tích hợp dữ liệu).

    Bạn phải có đặc quyền của quản trị viên đối với Báo cáo.

  2. Nhấp vào Khoảng không quảng cáo trên Drive.
  3. Nhấp vào Mã dự án BigQuery rồi chọn dự án.
  4. Nhấp vào Xóa.
  5. Để xác nhận, hãy nhấp lại vào Xoá.

Dữ liệu về các mục trên Drive của bạn sẽ không được xuất nữa. Tập dữ liệu vẫn nằm trong dự án có dữ liệu hiện tại, nhưng dữ liệu sẽ bị xoá khi hết hạn.

Để khởi động lại lệnh xuất kho hàng trên Drive, hãy thêm mã dự án.

Tại sao tài khoản dịch vụ được thêm vào dự án và tập dữ liệu BigQuery của tôi?

Bạn có thể thấy một tài khoản dịch vụ có tên là id@gcp-sa-statefulreporting.iam.gserviceaccount.com và một tài khoản dịch vụ khác có tên là drive-inventory-reporting@system.gserviceaccount.com trong danh sách quyền của dự án và tập dữ liệu BigQuery. Trong giai đoạn thử nghiệm, một tài khoản dịch vụ được dùng để đọc siêu dữ liệu từ Drive và tài khoản còn lại được dùng để ghi dữ liệu về các mục trên Drive vào BigQuery.

Tại sao tôi gặp lỗi tài khoản dịch vụ khi cố gắng thiết lập tính năng xuất kho hàng trên Drive?

Nếu chính sách tổ chức ngăn các tài khoản dịch vụ id@gcp-sa-statefulreporting.iam.gserviceaccount.comdrive-inventory-reporting@system.gserviceaccount.com tham gia danh sách quyền, thì bạn phải đưa miền của các tài khoản này vào danh sách cho phép.

Tại sao tôi gặp lỗi về quyền khi cố gắng thiết lập tính năng xuất kho hàng từ Drive?

Bạn phải có quyền xem và quản trị chính sách cho phép đối với dự án để thiết lập tính năng xuất kho hàng trên Drive. Trong Google Cloud Console, hãy chuyển đến trang IAM rồi chỉ định vai trò Quản trị viên IAM dự án (roles/resourcemanager.projectIamAdmin) cho tài khoản quản trị viên Google Workspace của bạn.

Tính năng Khu vực hoá dữ liệu có được hỗ trợ cho tính năng xuất dữ liệu về các mục trên Drive không?

Có. Nếu bạn thiết lập một chính sách về khu vực lưu trữ dữ liệu trong Bảng điều khiển dành cho quản trị viên, thì dữ liệu của bạn sẽ được xử lý ở khu vực đó. Tuy nhiên, dữ liệu xuất của bạn trong BigQuery sẽ được ghi vào khu vực mà bạn chỉ định khi tạo tập dữ liệu. Để biết chi tiết, hãy xem bài viết Vị trí của BigQuery