สคีมาและการค้นหาตัวอย่างสำหรับการส่งออกข้อมูลเมตาในไดรฟ์ใน BigQuery

รุ่นที่รองรับฟีเจอร์นี้ ได้แก่ Frontline Plus; Enterprise Standard และ Enterprise Plus; Education Standard และ Education Plus; Enterprise Essentials Plus; Cloud Identity Premium เปรียบเทียบรุ่นของคุณ

หลังจากตั้งค่าการส่งออกข้อมูลเมตาในไดรฟ์แล้ว คุณจะวิเคราะห์ชุดข้อมูลใน BigQuery ได้ หน้านี้อธิบายสคีมาตารางและการค้นหาตัวอย่างสำหรับรายงานทั่วไปที่ได้รับจาก BigQuery

หมายเหตุ: คุณต้องตั้งค่าการเรียกเก็บเงินสำหรับโปรเจ็กต์ Google Cloud เนื่องจากจะมีค่าใช้จ่ายการส่งออกและการค้นหาพื้นที่เก็บข้อมูลในไดรฟ์ใน BigQuery เปิดใช้การเรียกเก็บเงินให้กับโปรเจ็กต์

สคีมาการส่งออกข้อมูลเมตาในไดรฟ์

สคีมาและคำจำกัดความ

การส่งออกคลังข้อมูลเมตาในไดรฟ์จะเพิ่มไปยังชุดข้อมูล BigQuery โดยมีสคีมาต่อไปนี้

ชื่อ ช่องสคีมา คำอธิบาย
รหัสสินค้า id ตัวระบุรายการในไดรฟ์ที่ไม่ซ้ำกัน
เวอร์ชัน version หมายเลขเวอร์ชันล่าสุดของไฟล์ ซึ่งเวอร์ชันไฟล์มีจำนวนเพิ่มขึ้นเรื่อยๆ โดยจะเป็นการแสดงการเปลี่ยนแปลงทั้งหมดที่ทำกับไฟล์ในเซิร์ฟเวอร์ แม้ว่าผู้ใช้จะมองไม่เห็นก็ตาม
รหัสเจ้าของ owner.user.id

รหัสผู้ใช้ของเจ้าของไฟล์ สำหรับรายการที่ผู้ใช้เป็นเจ้าของ

อีเมลเจ้าของ owner.user.email อีเมลของเจ้าของไฟล์ สำหรับรายการที่ผู้ใช้เป็นเจ้าของ
รหัสไดรฟ์ที่แชร์ owner.shared_drive.id รหัสไดรฟ์ที่แชร์ สำหรับรายการในไดรฟ์ที่แชร์
ผู้สร้าง creator อีเมลและรหัสผู้ใช้ของผู้สร้างไอเทม ฟิลด์นี้จะไม่มีการป้อนข้อมูลหากผู้สร้างไม่สามารถเข้าถึงรายการได้อีกต่อไป
การประทับเวลาของสแนปชอต snapshot_start_time_micros และ snapshot_end_time_micros การประทับเวลาที่เริ่มต้นและสิ้นสุดการสร้างรายงาน
เวลาในการอ่าน read_time_micros การประทับเวลาของเวลาที่อ่านข้อมูลเมตาของรายการในไดรฟ์
ชื่อ title

ชื่อไฟล์ที่ผู้ใช้ระบุ

คำอธิบาย description คำอธิบายสั้นๆ ของรายการ
สถานะอยู่ในถังขยะ trashed ย้ายรายการไปที่ถังขยะแล้วแต่อาจยังไม่ได้ลบ
ประเภท MIME mime_type ประเภท MIME ของรายการ ดูประเภท MIME ที่รองรับของ Google Workspace และ Google ไดรฟ์
นามสกุลไฟล์ file_extension คอมโพเนนต์สุดท้ายของนามสกุลไฟล์แบบเต็ม ซึ่งดึงมาจากฟิลด์ชื่อ ข้อมูลนี้มีอยู่สำหรับรายการที่มีเนื้อหาไบนารีใน Google ไดรฟ์เท่านั้น
เวลาที่สร้าง create_time_micros การประทับเวลาของเวลาที่สร้างรายการ
เวลาที่แก้ไขล่าสุด last_modified_time_micros การประทับเวลาที่มีผู้แก้ไขรายการครั้งล่าสุด
ขนาดไฟล์ file_size_bytes ขนาดในหน่วยไบต์ของไฟล์ BLOB และไฟล์เครื่องมือแก้ไขเอกสาร ระบบจะไม่รายงานข้อมูลนี้สำหรับรายการที่ไม่มีขนาด เช่น ทางลัดและโฟลเดอร์
โควต้าที่ใช้ไป consumed_quota_bytes จำนวนโควต้าพื้นที่เก็บข้อมูลที่ใช้ในหน่วยไบต์ของรายการ ซึ่งรวมถึงการแก้ไขหลักและการแก้ไขก่อนหน้านี้ที่เก็บไว้
รหัสไดรฟ์ที่แชร์ shared_drive_id รหัสไดรฟ์ที่แชร์ สำหรับรายการในไดรฟ์ที่แชร์
หน่วยขององค์กร org_unit_path หน่วยขององค์กรของเจ้าของรายการ
ตรวจสอบข้อผิดพลาด md5_checksum การตรวจสอบข้อผิดพลาด MD5 สำหรับเนื้อหาของรายการ
การเข้ารหัสฝั่งไคลเอ็นต์ client_side_encrypted บูลีนซึ่งระบุว่ารายการมีการเข้ารหัสฝั่งไคลเอ็นต์หรือไม่
โฟลเดอร์ระดับบนสุด parent รหัสของโฟลเดอร์หลักของรายการ
ป้ายกำกับที่ใช้* applied_labels.id รหัสของป้ายกำกับที่ใช้กับรายการ
applied_labels.title ชื่อทรัพยากรของป้ายกำกับที่ใช้กับรายการ
applied_labels.field_values.id

รหัสของฟิลด์ที่ไม่ซ้ำกันภายในป้ายกำกับหรือไลบรารี

applied_labels.field_values.type

ประเภทของฟิลด์ ซึ่งอาจมีสถานะใดสถานะหนึ่งดังต่อไปนี้

applied_labels.field_values.display_name

ข้อความที่จะแสดงใน UI ที่ระบุฟิลด์
รหัสเป้าหมายของทางลัด shortcut_target_id รหัสของไฟล์หรือโฟลเดอร์ที่ทางลัดนี้ชี้ไป
สิทธิ์ access.permissions.permission_id

รหัสของสิทธิ์นี้ ซึ่งเป็นตัวระบุที่ไม่ซ้ำกันสำหรับผู้รับสิทธิ์

หมายเหตุ: รหัสสิทธิ์ไม่เหมือนกับรหัสผู้ใช้

access.permissions.name

ชื่อที่ "น่ารัก" ของค่าของสิทธิ์ โดยตัวอย่างสิทธิ์แต่ละประเภทมีดังนี้

  • user - ชื่อเต็มของผู้ใช้ตามที่กำหนดไว้สำหรับบัญชี Google เช่น "Dana Cruz"
  • group - ชื่อกลุ่ม เช่น "ผู้ดูแลระบบตัวอย่าง"
  • domain - ชื่อโดเมนสตริง เช่น "example.com"
  • anyone - ไม่ได้รายงานชื่อ
access.permissions.type

ประเภทของสิทธิ์ ค่าที่ใช้ได้มีดังนี้

  • user
  • group
  • domain
  • anyone
access.permissions.role

บทบาทที่ได้รับจากสิทธิ์นี้ ค่าที่ใช้ได้มีดังนี้

  • owner
  • organizer
  • fileOrganizer
  • writer
  • commenter
  • reader

หมายเหตุ: ดูรายละเอียดเกี่ยวกับประเภทที่หัวข้อบทบาทและสิทธิ์

access.permissions.view

หากสิทธิ์เป็นของข้อมูลการแสดงผล ค่าจะเป็น published

access.permissions.allow_file_discovery

สิทธิ์อนุญาตให้ไฟล์สามารถค้นหาได้หรือไม่ โดยจะรายงานเฉพาะสิทธิ์ประเภท domain หรือ anyone เท่านั้น
access.permissions.email อีเมลของผู้ใช้หรือกลุ่มที่สิทธิ์นี้อ้างอิง
access.permissions.domain ชื่อโดเมนของเอนทิตีที่สิทธิ์นี้อ้างอิงถึง ซึ่งจะปรากฏขึ้นเมื่อประเภทสิทธิ์คือ user, group หรือ domain
access.permissions.user_id รหัสผู้ใช้ที่เชื่อมโยงกับอีเมลในสิทธิ์
access.permissions.permission_details
.permission_type
ประเภทสิทธิ์สำหรับผู้ใช้
access.permissions.permission_details.role บทบาทหลักของผู้ใช้
access.permissions.permission_details
.inherited_from
รหัสของรายการที่สิทธิ์นี้รับค่ามา ระบบจะป้อนข้อมูลนี้สำหรับรายการในไดรฟ์ที่แชร์เท่านั้น
access.permissions.permission_details
.inherited
บูลีนที่ระบุว่าสิทธิ์นั้นได้รับค่ามาหรือไม่
access.permissions.inherited_permissions
_disabled
ไม่ว่าจะปิดใช้สิทธิ์ที่รับค่ามาสำหรับรายการนี้หรือไม่ ซึ่งใช้ได้กับโฟลเดอร์ที่มีการจำกัดการเข้าถึงเท่านั้น

* หมายถึงป้ายกำกับที่ใช้กับรายการในไดรฟ์

ตัวอย่างการค้นหา

ตัวอย่างการค้นหาเหล่านี้จะถือว่าใช้ SQL เดิม โดยแทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณเอง ดูข้อมูลเพิ่มเติมเกี่ยวกับการค้นหาข้อมูล BigQuery

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ

แสดงผลตารางที่มีรหัสไฟล์ ชื่อไฟล์ อีเมลเจ้าของ และประเภท

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permission
  WHERE permission.allow_file_discovery = true
)

ค้นหารายการที่มีป้ายกำกับที่ต้องการ

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ แทนที่ label_id ด้วยรหัสป้ายกำกับของคุณ ซึ่งสามารถดูได้ในเครื่องมือจัดการป้ายกำกับ

การค้นหานี้จะแสดงตารางที่มีรหัสไฟล์ ชื่อไฟล์ อีเมลเจ้าของ และประเภท

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(applied_labels) AS label
  WHERE label.id = label_id
)

ค้นหาผู้ใช้ที่ใช้พื้นที่เก็บข้อมูล Google ไดรฟ์เกินเกณฑ์

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ แทนที่ threshold ด้วยเกณฑ์ของคุณในหน่วย MB เช่น หากต้องการค้นหาผู้ที่ใช้พื้นที่เก็บข้อมูล Google ไดรฟ์มากกว่า 15 GB บรรทัดก่อนสุดท้ายจะเป็น HAVING total_storage_mb > 15000

การค้นหานี้จะแสดงตารางอีเมลของผู้ใช้และพื้นที่เก็บข้อมูล Google ไดรฟ์ทั้งหมดที่ใช้ในหน่วย MB โดยจัดเรียงจากมากไปน้อย

SELECT owner.user.email AS user_email,
  SUM(size_bytes) / (1000000) AS total_storage_mb
FROM project_name.dataset_name
GROUP BY user_email
HAVING total_storage_mb > threshold
ORDER BY total_storage_mb DESC

ดูว่ารายการประเภทใดใช้พื้นที่มากที่สุด

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ

การค้นหานี้จะแสดงตารางประเภทรายการตามขนาดจากน้อยไปมาก

SELECT mime_type, SUM(consumed_quota_bytes) AS total_consumed
FROM project_name.dataset_name
GROUP BY mime_type
ORDER BY total_consumed DESC

ค้นหารายการที่เข้ารหัสด้วยการเข้ารหัสฝั่งไคลเอ็นต์ (CSE)

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ

SELECT id, owner.user.email, title
FROM project_name.dataset_name
WHERE mime_type LIKE '%.encrypted'

ค้นหารายการที่แชร์กับผู้ใช้ที่ต้องการ

แทนที่ project_name.dataset_name ด้วยชื่อโปรเจ็กต์และชื่อชุดข้อมูลของคุณ แทนที่ user@example.com ด้วยผู้ใช้ที่เฉพาะเจาะจงของคุณ

หมายเหตุ: คำค้นหานี้จะไม่พบการแชร์สำหรับผู้ใช้ผ่านกลุ่มหรือการเป็นสมาชิกกลุ่มเป้าหมาย

SELECT id, title, mime_type, owner.user.email as owner_email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permissions
  WHERE permissions.email = user@example.com
)