Giản đồ và truy vấn mẫu để xuất dữ liệu về các mục trên Drive trong BigQuery

Các phiên bản hỗ trợ tính năng này: Frontline Plus; Enterprise Standard và Enterprise Plus; Education Standard và Education Plus; Enterprise Essentials Plus; Cloud Identity Premium. So sánh phiên bản của bạn

Sau khi thiết lập chế độ xuất thông tin về các mục trên Drive, bạn có thể phân tích tập dữ liệu trong BigQuery. Trang này mô tả giản đồ bảng và các truy vấn mẫu cho những báo cáo thường gặp mà bạn có thể nhận được từ BigQuery.

Lưu ý: Bạn phải thiết lập thông tin thanh toán cho dự án Google Cloud vì việc xuất và truy vấn kho tài sản trên Drive trong BigQuery sẽ phát sinh chi phí. Bật tính năng thanh toán cho một dự án.

Giản đồ xuất dữ liệu về các mục trên Drive

Giản đồ và định nghĩa

Dữ liệu xuất về các mục trên Drive sẽ được thêm vào tập dữ liệu BigQuery theo giản đồ sau:

Tên Trường giản đồ Mô tả
Mã mặt hàng id Giá trị nhận dạng duy nhất của mục trên Drive.
Phiên bản version Số phiên bản mới nhất của tệp. Phiên bản tệp là một số tăng dần đơn điệu. Điều này phản ánh mọi thay đổi đối với tệp trên máy chủ, ngay cả những thay đổi mà người dùng không thấy được.
ID chủ sở hữu owner.user.id

Đối với các mục thuộc sở hữu của người dùng, mã nhận dạng người dùng của chủ sở hữu tệp.

Email của chủ sở hữu owner.user.email Đối với những mục thuộc sở hữu của người dùng, email của chủ sở hữu tệp.
Mã bộ nhớ dùng chung owner.shared_drive.id Đối với các mục trong bộ nhớ dùng chung, mã nhận dạng của bộ nhớ dùng chung.
Nhà sáng tạo creator Email và mã nhận dạng người dùng của người tạo mục. Trường này sẽ không được điền sẵn nếu nhà sáng tạo không còn quyền truy cập vào mục đó nữa.
Dấu thời gian của ảnh chụp nhanh snapshot_start_time_microssnapshot_end_time_micros Dấu thời gian cho biết thời điểm bắt đầu và kết thúc quá trình tạo báo cáo.
Thời gian đọc read_time_micros Dấu thời gian cho biết thời điểm siêu dữ liệu của mục trên Drive được đọc.
Tiêu đề title

Tiêu đề tệp do người dùng chỉ định.

Mô tả description Nội dung mô tả ngắn về mặt hàng.
Trạng thái đã chuyển vào thùng rác trashed Mục này đã được chuyển vào thùng rác nhưng chưa bị xoá hay chưa.
Loại MIME mime_type Loại MIME của mục. Xem các loại MIME được hỗ trợ trong Google Workspace và Google Drive.
Đuôi tệp file_extension Thành phần cuối cùng của đuôi tệp đầy đủ, được trích xuất từ trường tên. Tính năng này chỉ dùng được cho các mục có nội dung nhị phân trong Google Drive
Thời gian tạo create_time_micros Dấu thời gian cho biết thời điểm tạo mặt hàng.
Lần Sửa đổi Cuối cùng last_modified_time_micros Dấu thời gian của lần gần đây nhất mà một người nào đó sửa đổi mục.
Kích thước tệp file_size_bytes Kích thước tính bằng byte của các tệp blob và tệp trong Bộ công cụ chỉnh sửa tài liệu. Không được báo cáo cho những mục không có kích thước, chẳng hạn như lối tắt và thư mục.
Hạn mức đã sử dụng consumed_quota_bytes Số lượng hạn mức bộ nhớ (tính bằng byte) mà mục này sử dụng. Trong đó có cả bản sửa đổi mới nhất cũng như những bản sửa đổi trước đó đã được giữ lại.
Mã bộ nhớ dùng chung shared_drive_id Đối với các mục trong bộ nhớ dùng chung, mã nhận dạng của bộ nhớ dùng chung.
Đơn vị Tổ chức: org_unit_path Đơn vị tổ chức của chủ sở hữu mục.
Checksum md5_checksum Tổng kiểm tra MD5 cho nội dung của mặt hàng.
Mã hoá phía máy khách client_side_encrypted Giá trị boolean cho biết liệu mục có được mã hoá phía máy khách hay không .
Thư mục mẹ parent Mã của thư mục mẹ của mục.
Nhãn được áp dụng* applied_labels.id Mã nhận dạng của nhãn được áp dụng cho mặt hàng.
applied_labels.title Tên tài nguyên của nhãn được áp dụng cho mặt hàng.
applied_labels.field_values.id

Mã nhận dạng của một trường, riêng biệt trong một nhãn hoặc thư viện.

applied_labels.field_values.type

Loại trường. Có thể là một trong những trạng thái sau:

applied_labels.field_values.display_name

Văn bản sẽ xuất hiện trong giao diện người dùng để xác định trường.
Mã đích của lối tắt shortcut_target_id Mã của tệp hoặc thư mục mà lối tắt này trỏ đến.
Quyền access.permissions.permission_id

Mã nhận dạng của quyền này. Đây là giá trị nhận dạng riêng biệt của bên được cấp.

Lưu ý: Mã nhận dạng quyền không giống với mã nhận dạng người dùng.

access.permissions.name

Tên "đẹp" của giá trị quyền. Sau đây là danh sách ví dụ cho từng loại quyền:

  • user – Tên đầy đủ của người dùng, theo định nghĩa cho Tài khoản Google của họ, chẳng hạn như "Dana Cruz"
  • group – Tên của nhóm, chẳng hạn như "Quản trị viên ví dụ"
  • domain – Tên miền dạng chuỗi, chẳng hạn như "example.com"
  • anyone – Không có tên được báo cáo
access.permissions.type

Loại quyền. Các giá trị hợp lệ là:

  • user
  • group
  • domain
  • anyone
access.permissions.role

Vai trò được cấp theo quyền này. Các giá trị hợp lệ là:

  • owner
  • organizer
  • fileOrganizer
  • writer
  • commenter
  • reader

Lưu ý: Hãy xem phần vai trò và quyền để biết thông tin chi tiết về loại.

access.permissions.view

Nếu quyền thuộc về một chế độ xem, giá trị sẽ là published.

access.permissions.allow_file_discovery

Quyền này có cho phép tìm kiếm tệp hay không. Chỉ được báo cáo cho các quyền thuộc loại domain hoặc anyone.
access.permissions.email Địa chỉ email của người dùng hoặc nhóm mà quyền này đề cập đến.
access.permissions.domain Tên miền của thực thể mà quyền này đề cập đến. Tham số này xuất hiện khi loại quyền là user, group hoặc domain.
access.permissions.user_id Mã nhận dạng người dùng được liên kết với email về các quyền.
access.permissions.permission_details
.permission_type
Loại quyền của người dùng.
access.permissions.permission_details.role Vai trò chính của người dùng.
access.permissions.permission_details
.inherited_from
Mã nhận dạng của mục mà quyền này được kế thừa. Trường này chỉ được điền sẵn cho các mục trong bộ nhớ dùng chung.
access.permissions.permission_details
.inherited
Giá trị boolean cho biết liệu quyền có được kế thừa hay không.
access.permissions.inherited_permissions
_disabled
Các quyền được kế thừa có bị vô hiệu hoá đối với mục này hay không. Chỉ đúng đối với các thư mục có quyền truy cập bị giới hạn.

* Đề cập đến nhãn được áp dụng cho các mục trong Drive.

Ví dụ về truy vấn

Các ví dụ về truy vấn này giả định SQL cũ. Thay thế project_name.dataset_name bằng tên dự án và tên tập dữ liệu của riêng bạn. Tìm hiểu thêm về cách truy vấn dữ liệu BigQuery.

Thay thế project_name.dataset_name bằng tên dự án và tên tập dữ liệu của bạn.

Trả về một bảng có mã tệp, tiêu đề, email của chủ sở hữu và loại tệp.

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permission
  WHERE permission.allow_file_discovery = true
)

Tìm các mục có một nhãn cụ thể

Thay thế project_name.dataset_name bằng tên dự án và tên tập dữ liệu của bạn. Thay thế label_id bằng mã nhận dạng nhãn của bạn. Bạn có thể lấy mã này trong trình quản lý nhãn.

Truy vấn này trả về một bảng có mã tệp, tiêu đề, email của chủ sở hữu và loại tệp.

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(applied_labels) AS label
  WHERE label.id = label_id
)

Tìm những người dùng có mức sử dụng bộ nhớ trên Drive vượt quá ngưỡng

Thay thế project_name.dataset_name bằng tên dự án và tên tập dữ liệu của bạn. Thay thế threshold bằng ngưỡng của bạn tính bằng MB. Ví dụ: để tìm những người dùng sử dụng bộ nhớ Drive trên 15 GB, dòng áp chót là HAVING total_storage_mb > 15000.

Truy vấn này trả về một bảng gồm email người dùng và tổng dung lượng lưu trữ đã sử dụng trên Drive (tính bằng MB) theo thứ tự giảm dần.

SELECT owner.user.email AS user_email,
  SUM(size_bytes) / (1000000) AS total_storage_mb
FROM project_name.dataset_name
GROUP BY user_email
HAVING total_storage_mb > threshold
ORDER BY total_storage_mb DESC

Tìm hiểu xem loại mục nào chiếm nhiều dung lượng nhất

Thay thế project_name.dataset_name bằng tên dự án và tên tập dữ liệu của bạn.

Truy vấn này trả về một bảng các loại mặt hàng theo kích thước giảm dần.

SELECT mime_type, SUM(consumed_quota_bytes) AS total_consumed
FROM project_name.dataset_name
GROUP BY mime_type
ORDER BY total_consumed DESC

Tìm các mục được mã hoá bằng tính năng mã hoá phía máy khách (CSE)

Thay thế project_name.dataset_name bằng tên dự án và tên tập dữ liệu của bạn.

SELECT id, owner.user.email, title
FROM project_name.dataset_name
WHERE mime_type LIKE '%.encrypted'

Tìm các mục được chia sẻ với một người dùng cụ thể

Thay thế project_name.dataset_name bằng tên dự án và tên tập dữ liệu của bạn. Thay thế user@example.com bằng người dùng cụ thể của bạn.

Lưu ý: Truy vấn này không tìm thấy hoạt động chia sẻ của người dùng thông qua nhóm hoặc tư cách thành viên của đối tượng mục tiêu.

SELECT id, title, mime_type, owner.user.email as owner_email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permissions
  WHERE permissions.email = user@example.com
)