สคีมาและการค้นหาตัวอย่างสำหรับการส่งออกข้อมูลเมตาในไดรฟ์ใน BigQuery

รุ่นที่รองรับฟีเจอร์นี้ ได้แก่ Frontline Plus, Enterprise Standard และ Enterprise Plus, Education Standard และ Education Plus, Enterprise Essentials Plus, Cloud Identity Premium เปรียบเทียบรุ่นของคุณ

หลังจากตั้งค่าการส่งออกข้อมูลเมตาในไดรฟ์แล้ว คุณจะวิเคราะห์ชุดข้อมูลใน BigQuery ได้ หน้านี้อธิบายสคีมาตารางและการค้นหาตัวอย่าง สำหรับรายงานทั่วไปที่ได้รับจาก BigQuery

หมายเหตุ: คุณต้องตั้งค่าการเรียกเก็บเงินสำหรับโปรเจ็กต์ Google Cloud เนื่องจากจะมีค่าใช้จ่ายในการส่งออกและค้นหาข้อมูลเมตาในไดรฟ์ใน BigQuery เปิดใช้การเรียกเก็บเงินสำหรับ โปรเจ็กต์

สคีมาการส่งออกข้อมูลเมตาในไดรฟ์

สคีมาและคำจำกัดความ

การส่งออกคลังข้อมูลเมตาในไดรฟ์จะเพิ่มไปยังชุดข้อมูล BigQuery โดยมีสคีมาต่อไปนี้

ชื่อ ฟิลด์สคีมา คำอธิบาย
รหัสรายการ id ตัวระบุรายการในไดรฟ์ที่ไม่ซ้ำกัน
เวอร์ชัน version หมายเลขเวอร์ชันล่าสุดของไฟล์ ซึ่งเวอร์ชันไฟล์มีจำนวนเพิ่มขึ้นเรื่อยๆ โดยจะเป็นการแสดงการเปลี่ยนแปลงทั้งหมดที่ทำกับไฟล์ในเซิร์ฟเวอร์ แม้ว่าผู้ใช้จะมองไม่เห็นก็ตาม

เจ้าของ

owner.user.id

รหัสผู้ใช้ของเจ้าของไฟล์ สำหรับรายการที่ผู้ใช้เป็นเจ้าของ

owner.user.email

อีเมลของเจ้าของไฟล์ สำหรับรายการที่ผู้ใช้เป็นเจ้าของ

owner.shared_drive.id

รหัสไดรฟ์ที่แชร์ สำหรับรายการในไดรฟ์ที่แชร์

ผู้สร้าง creator อีเมลและรหัสผู้ใช้ของผู้สร้างไอเทม ฟิลด์นี้จะไม่มีการป้อนข้อมูลหากผู้สร้างไม่สามารถเข้าถึงรายการได้อีกต่อไป
การประทับเวลาของการสร้าง snapshot_start_time_micros และ snapshot_end_time_micros การประทับเวลาที่เริ่มต้นและสิ้นสุดการสร้างรายงาน
เวลาในการอ่าน read_time_micros การประทับเวลาของเวลาที่อ่านข้อมูลเมตาของรายการในไดรฟ์
Title (ชื่อ) title

ชื่อไฟล์ที่ผู้ใช้ระบุ

คำอธิบาย description คำอธิบายสั้นๆ ของรายการ
สถานะอยู่ในถังขยะ trashed ย้ายรายการไปที่ถังขยะแล้วแต่อาจยังไม่ได้ลบ
ประเภท MIME mime_type ประเภท MIME ของรายการ ดูประเภท MIME ที่รองรับของ Google Workspace และ Google ไดรฟ์
นามสกุลไฟล์ file_extension คอมโพเนนต์สุดท้ายของนามสกุลไฟล์แบบเต็ม ซึ่งดึงมาจากฟิลด์ชื่อ ข้อมูลนี้มีอยู่สำหรับรายการที่มีเนื้อหาไบนารีใน Google ไดรฟ์เท่านั้น
เวลาที่สร้าง create_time_micros การประทับเวลาของเวลาที่สร้างรายการ
เวลาที่แก้ไขล่าสุด last_modified_time_micros การประทับเวลาที่มีผู้แก้ไขรายการครั้งล่าสุด
ขนาด (ไบต์) size_bytes ขนาดในหน่วยไบต์ของไฟล์ BLOB และไฟล์เครื่องมือแก้ไขเอกสาร ระบบจะไม่รายงานข้อมูลนี้สำหรับรายการที่ไม่มีขนาด เช่น ทางลัดและโฟลเดอร์
โควต้าที่ใช้ไป consumed_quota_bytes จำนวนโควต้าพื้นที่เก็บข้อมูลที่ใช้ในหน่วยไบต์ของรายการ ซึ่งรวมถึงการแก้ไขหลักและการแก้ไขก่อนหน้านี้ที่เก็บไว้
หน่วยขององค์กร org_unit_path หน่วยขององค์กรของเจ้าของรายการ
ตรวจสอบข้อผิดพลาด md5_checksum การตรวจสอบข้อผิดพลาด MD5 สำหรับเนื้อหาของรายการ
การเข้ารหัสฝั่งไคลเอ็นต์ client_side_encrypted บูลีนซึ่งระบุว่ารายการมีการเข้ารหัสฝั่งไคลเอ็นต์หรือไม่
โฟลเดอร์ระดับบนสุด parent รหัสของโฟลเดอร์หลักของรายการ

ระบบจะไม่แสดงโฟลเดอร์หลักในกรณีต่อไปนี้

  1. ไฟล์จะอยู่ในโฟลเดอร์ระดับบนสุดของไดรฟ์ของฉันของผู้ใช้
  2. โดเมนไม่ได้เป็นเจ้าของโฟลเดอร์หลัก
ป้ายกำกับที่ใช้* applied_labels.id รหัสของป้ายกำกับที่ใช้กับรายการ
applied_labels.title ชื่อทรัพยากรของป้ายกำกับที่ใช้กับรายการ
applied_labels.field_values.id

รหัสของฟิลด์ที่ไม่ซ้ำกันภายในป้ายกำกับหรือไลบรารี

applied_labels.field_values.type

ประเภทของฟิลด์ ซึ่งอาจมีสถานะใดสถานะหนึ่งดังต่อไปนี้

applied_labels.field_values.display_name

ข้อความที่จะแสดงใน UI ที่ระบุฟิลด์
รหัสเป้าหมายของทางลัด shortcut_target_id รหัสของไฟล์หรือโฟลเดอร์ที่ทางลัดนี้ชี้ไป
สิทธิ์ access.permissions.permission_id

รหัสของสิทธิ์นี้ ซึ่งเป็นตัวระบุที่ไม่ซ้ำกันสำหรับผู้รับสิทธิ์

หมายเหตุ: รหัสสิทธิ์ไม่เหมือนกับรหัสผู้ใช้

access.permissions.name

ชื่อที่ "น่ารัก" ของค่าของสิทธิ์ โดยตัวอย่างสิทธิ์แต่ละประเภทมีดังนี้

  • user - ชื่อเต็มของผู้ใช้ตามที่กำหนดไว้สำหรับบัญชี Google เช่น "Dana Cruz"
  • group - ชื่อกลุ่ม เช่น "ผู้ดูแลระบบตัวอย่าง"
  • domain - ชื่อโดเมนสตริง เช่น "example.com"
  • anyone - ไม่ได้รายงานชื่อ
access.permissions.type

ประเภทของสิทธิ์ ค่าที่ใช้ได้มีดังนี้

  • user
  • group
  • domain
  • anyone
access.permissions.role

บทบาทที่ได้รับจากสิทธิ์นี้ ค่าที่ใช้ได้มีดังนี้

  • owner
  • organizer
  • fileOrganizer
  • writer
  • commenter
  • reader

หมายเหตุ: ดูรายละเอียดเกี่ยวกับประเภทที่หัวข้อบทบาทและสิทธิ์

access.permissions.view

หากสิทธิ์เป็นของข้อมูลการแสดงผล ค่าจะเป็น published

access.permissions.allow_file_discovery

สิทธิ์อนุญาตให้ไฟล์สามารถค้นหาได้หรือไม่ โดยจะรายงานเฉพาะสิทธิ์ประเภท domain หรือ anyone เท่านั้น
access.permissions.email อีเมลของผู้ใช้หรือกลุ่มที่สิทธิ์นี้อ้างอิง
access.permissions.domain ชื่อโดเมนของเอนทิตีที่สิทธิ์นี้อ้างอิงถึง ซึ่งจะปรากฏขึ้นเมื่อประเภทสิทธิ์คือ user, group หรือ domain
access.permissions.user_id รหัสผู้ใช้ที่เชื่อมโยงกับอีเมลในสิทธิ์
access.permissions.permission_details
.permission_type
ประเภทสิทธิ์สำหรับผู้ใช้
access.permissions.permission_details.role บทบาทหลักของผู้ใช้
access.permissions.permission_details
.inherited_from
รหัสของรายการที่สิทธิ์นี้รับค่ามา ระบบจะป้อนข้อมูลนี้สำหรับรายการในไดรฟ์ที่แชร์เท่านั้น
access.permissions.permission_details
.inherited
บูลีนที่ระบุว่าสิทธิ์นั้นได้รับค่ามาหรือไม่
access.permissions.inherited_permissions
_disabled
ไม่ว่าจะปิดใช้สิทธิ์ที่รับค่ามาสำหรับรายการนี้หรือไม่ ซึ่งใช้ได้กับโฟลเดอร์ที่มีการจำกัดการเข้าถึงเท่านั้น

* หมายถึงป้ายกำกับที่ใช้กับรายการในไดรฟ์

สคีมาของไดรฟ์ที่แชร์

ตารางไดรฟ์ที่แชร์

ตารางนี้แสดงรายละเอียดสคีมาสำหรับฟิลด์เฉพาะของไดรฟ์ที่แชร์ในการส่งออกข้อมูลเมตาในไดรฟ์

ชื่อ ฟิลด์สคีมา คำอธิบาย
รหัสไดรฟ์ที่แชร์ shared_drive_id ตัวระบุไดรฟ์ที่แชร์ที่ไม่ซ้ำกัน
ชื่อไดรฟ์ที่แชร์ name ชื่อของไดรฟ์ที่แชร์ตามที่ผู้ใช้กำหนด
เวลาในการอ่าน read_time_micros การประทับเวลาเมื่ออ่านข้อมูลเมตาของไดรฟ์ที่แชร์เป็นไมโครวินาที

ตัวอย่างการค้นหา

ตัวอย่างการค้นหาเหล่านี้จะถือว่าใช้ SQL เดิม ดูข้อมูลเพิ่มเติมเกี่ยวกับการค้นหาข้อมูล BigQuery

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ

การค้นหานี้จะแสดงตารางที่มีรหัสไฟล์ ชื่อไฟล์ อีเมลเจ้าของ และประเภท

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permission
  WHERE permission.allow_file_discovery = true
)

ค้นหารายการที่มีป้ายกำกับที่ต้องการ

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ แทนที่ label_id ด้วยรหัสป้ายกำกับของคุณ ซึ่งสามารถดูได้ในเครื่องมือจัดการป้ายกำกับ

การค้นหานี้จะแสดงตารางที่มีรหัสไฟล์ ชื่อไฟล์ อีเมลเจ้าของ และประเภท

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(applied_labels) AS label
  WHERE label.id = label_id
)

ค้นหาผู้ใช้ที่ใช้พื้นที่เก็บข้อมูล Google ไดรฟ์เกินเกณฑ์

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ แทนที่ threshold ด้วยเกณฑ์ของคุณในหน่วย MB เช่น หากต้องการค้นหาผู้ที่ใช้พื้นที่เก็บข้อมูล Google ไดรฟ์มากกว่า 15 GB บรรทัดก่อนสุดท้ายจะเป็น HAVING total_storage_mb > 15000

การค้นหานี้จะแสดงตารางอีเมลของผู้ใช้และพื้นที่เก็บข้อมูล Google ไดรฟ์ทั้งหมดที่ใช้ในหน่วย MB โดยจัดเรียงจากมากไปน้อย

SELECT owner.user.email AS user_email,
  SUM(size_bytes) / (1000000) AS total_storage_mb
FROM project_name.dataset_name
GROUP BY user_email
HAVING total_storage_mb > threshold
ORDER BY total_storage_mb DESC

ดูว่ารายการประเภทใดใช้พื้นที่มากที่สุด

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ

การค้นหานี้จะแสดงตารางประเภทรายการตามขนาดจากน้อยไปมาก

SELECT mime_type, SUM(consumed_quota_bytes) AS total_consumed
FROM project_name.dataset_name
GROUP BY mime_type
ORDER BY total_consumed DESC

ค้นหารายการที่เข้ารหัสด้วยการเข้ารหัสฝั่งไคลเอ็นต์ (CSE)

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ

SELECT id, owner.user.email, title
FROM project_name.dataset_name
WHERE mime_type LIKE '%.encrypted'

ค้นหารายการที่แชร์กับผู้ใช้ที่ต้องการ

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ แทนที่ user@example.com ด้วยผู้ใช้ที่เฉพาะเจาะจงของคุณ

หมายเหตุ: คำค้นหานี้จะไม่พบการแชร์สำหรับผู้ใช้ผ่านกลุ่มหรือการเป็นสมาชิกกลุ่มเป้าหมาย

SELECT id, title, mime_type, owner.user.email as owner_email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permissions
  WHERE permissions.email = user@example.com
)

ค้นหารายการที่มีชื่อไดรฟ์ที่แชร์

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ

การค้นหานี้จะแสดงตารางที่มีชื่อรายการในไดรฟ์และชื่อไดรฟ์ที่แชร์

SELECT i.title, s.name
FROM project_name.dataset_name.inventory AS i
JOIN project_name.dataset_name.shared_drives AS s
ON i.owner.shared_drive.id = s.shared_drive_id;

ดูจำนวนรายการในไดรฟ์ที่แชร์

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ

การค้นหานี้จะแสดงตารางที่มีชื่อไดรฟ์ที่แชร์และจำนวนรายการ

SELECT  s.name as shared_drive, count(*) as item_count
FROM project_name.dataset_name.inventory AS i
JOIN project_name.dataset_name.shared_drives AS s
ON i.owner.shared_drive.id = s.shared_drive_id
GROUP BY shared_drive;