התכונה הזו נתמכת במהדורות הבאות: Frontline Plus, Enterprise Standard ו-Enterprise Plus, Education Standard ו-Education Plus, Enterprise Essentials Plus ו-Cloud Identity Premium. השוואה בין המהדורות
אחרי הגדרת הייצוא של מטא-נתונים ב-Drive, אפשר לנתח את מערך הנתונים ב-BigQuery. בדף הזה מפורטת סכימת הטבלה ומוצגות שאילתות לדוגמה של דוחות נפוצים שאפשר לקבל מ-BigQuery.
הערה: אתם צריכים להגדיר חיוב לפרויקט בענן שלכם ב-Google Cloud, כי יש עלות לייצוא ולשליחת שאילתות של מטא-נתונים ב-Drive ב-BigQuery. הפעלת חיוב בפרויקט .
סכימת ייצוא של מטא-נתונים ב-Drive
סכימה והגדרות
ייצוא מטא-נתונים ב-Drive מתווסף למערך הנתונים ב-BigQuery עם הסכימה הבאה:
| שם | שדה סכימה | תיאור |
|---|---|---|
| מזהה הפריט | id |
המזהה הייחודי של הפריט ב-Drive. |
| גרסה | version |
מספר הגרסה האחרונה של הקובץ. גרסת הקובץ היא מספר שגדל באופן מונוטוני. השינוי הזה משקף כל שינוי שבוצע בקובץ בשרת, גם אם הוא לא גלוי למשתמש. |
|
בעלים |
|
לפריטים שבבעלות המשתמש, מזהה המשתמש של בעל הקובץ. |
|
|
לגבי פריטים שנמצאים בבעלות של משתמש, האימייל של בעל הקובץ. |
|
|
|
לפריטים באחסון שיתופי, המזהה של האחסון השיתופי. |
|
| יוצר | creator |
כתובת האימייל ומזהה המשתמש של יוצר הפריט. השדה הזה לא יאוכלס אם ליוצר כבר אין גישה לפריט. |
| חותמות זמן של תמונות מצב | snapshot_start_time_micros וגם snapshot_end_time_micros |
חותמות הזמן של תחילת וסיום הפקת הדוח. |
| זמן קריאה | read_time_micros |
חותמת הזמן של מועד הקריאה של המטא-נתונים של הפריט ב-Drive. |
| שם | title |
השם שהמשתמש נתן לקובץ. |
| תיאור | description |
תיאור קצר של הפריט. |
| סטטוס העברה לאשפה | trashed |
האם הפריט הועבר לאשפה אבל עדיין לא נמחק. |
| סוג MIME | mime_type |
סוג ה-MIME של הפריט. סוגי MIME נתמכים ב-Google Workspace וב-Google Drive |
| סיומת הקובץ | file_extension |
הרכיב האחרון של סיומת הקובץ המלאה, שחולץ משדה השם. האפשרות הזו זמינה רק לפריטים עם תוכן בינארי ב-Google Drive |
| מועד היצירה | create_time_micros |
חותמת הזמן של מועד יצירת הפריט. |
| זמן השינוי האחרון | last_modified_time_micros |
חותמת הזמן של הפעם האחרונה שבה מישהו שינה את הפריט. |
| גודל (בייטים) | size_bytes |
הגודל בבייטים של קובצי Blob וקובצי עורכי Docs. לא מדווח על פריטים שאין להם גודל, כמו קיצורי דרך ותיקיות. |
| מכסה שנוצלה | consumed_quota_bytes |
מספר הבייטים של מכסת האחסון שנעשה בהם שימוש על ידי הפריט. הגרסאות האלה כוללות את הגרסה העדכנית וגם גרסאות קודמות שנשמרו. |
| יחידה ארגונית | org_unit_path |
היחידה הארגונית של הבעלים של הפריט. |
| סכום כולל | md5_checksum |
סכום הבדיקה (checksum) MD5 של תוכן הפריט. |
| הצפנה בצד-הלקוח | client_side_encrypted |
ערך בוליאני שמציין אם הפריט מוצפן מצד הלקוח . |
| תיקייה ראשית | parent |
המזהה של תיקיית ההורה של הפריט. התיקייה הראשית לא תאוכלס במקרים הבאים:
|
| התוויות שהוחלו* | applied_labels.id |
המזהה של התווית שהוחלה על הפריט. |
applied_labels.title |
שם המשאב של התווית שחלה על הפריט. | |
applied_labels.field_values.id |
המזהה של שדה, ייחודי בתוך תווית או ספרייה. |
|
|
|
סוג השדה. יכול להיות אחת מהאפשרויות הבאות: |
|
|
|
הטקסט שיוצג בממשק המשתמש כדי לזהות את השדה. | |
| מזהה היעד של קיצור הדרך | shortcut_target_id |
המזהה של הקובץ או התיקייה שאליהם קיצור הדרך הזה מצביע. |
| הרשאות | access.permissions.permission_id |
המזהה של ההרשאה. מזהה ייחודי של מקבל ההרשאה. הערה: מזהה ההרשאה שונה ממזהה המשתמש. |
access.permissions.name |
השם ה "יפה" של ערך ההרשאה. בהמשך מופיעה רשימת דוגמאות לכל סוג הרשאה:
|
|
access.permissions.type |
סוג ההרשאה. הערכים החוקיים הם:
|
|
access.permissions.role |
התפקיד שמוענק על ידי ההרשאה הזו. הערכים החוקיים הם:
הערה: למידע נוסף על הסוג, אפשר לעיין במאמר בנושא תפקידים והרשאות. |
|
access.permissions.view |
אם ההרשאה שייכת לתצוגה מפורטת, הערך הוא |
|
|
|
האם ההרשאה מאפשרת לחפש את הקובץ. הנתונים האלה מדווחים רק לגבי הרשאות מהסוגים domain או anyone. |
|
access.permissions.email |
כתובת האימייל של המשתמש או הקבוצה שאליהם מתייחסת ההרשאה. | |
access.permissions.domain |
שם הדומיין של הישות שאליה מתייחסת ההרשאה הזו. השדה הזה מופיע כשסוג ההרשאה הוא user, group או domain. |
|
access.permissions.user_id |
מזהה המשתמש שמשויך לאימייל בהרשאות. | |
access.permissions.permission_details |
סוג ההרשאה של המשתמש. | |
access.permissions.permission_details.role |
התפקיד הראשי של המשתמש. | |
access.permissions.permission_details |
המזהה של הפריט שממנו ההרשאה הזו עוברת בירושה. השדה הזה מאוכלס רק עבור פריטים באחסון שיתופי. | |
access.permissions.permission_details |
ערך בוליאני שמציין אם ההרשאה היא בירושה. | |
access.permissions.inherited_permissions |
האם ההרשאות שהועברו בירושה מושבתות לפריט הזה. ההגדרה הזו רלוונטית רק לתיקיות עם גישה מוגבלת. |
* מתייחס לתוויות שמוחלות על פריטים ב-Drive.
סכימה של תיקיות אחסון שיתופי
טבלה של תיקיות אחסון שיתופי
בטבלה מפורטת הסכימה של שדות ספציפיים לאחסון שיתופי בייצוא של מטא-נתונים ב-Drive.
| שם | שדה סכימה | תיאור |
|---|---|---|
| מזהה האחסון השיתופי | shared_drive_id |
המזהה הייחודי של האחסון השיתופי. |
| שם האחסון השיתופי | name |
השם של האחסון השיתופי, כפי שהמשתמש נתן אותו. |
| זמן קריאה | read_time_micros |
חותמת הזמן של מועד הקריאה של המטא-נתונים של האחסון השיתופי, במיקרו-שניות. |
דוגמאות לשאילתות
הדוגמאות האלה של שאילתות מבוססות על SQL מדור קודם. מידע נוסף על שליחת שאילתות של נתונים ב-BigQuery
חיפוש פריטים שאפשר למצוא באמצעות חיפוש ב-Drive
מחליפים את project_name.dataset_name בשם הפרויקט ובשם מערך הנתונים.
השאילתה הזו מחזירה טבלה עם מזהה הקובץ, הכותרת, כתובת האימייל של הבעלים והסוג.
SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
SELECT 1
FROM UNNEST(access.permissions) AS permission
WHERE permission.allow_file_discovery = true
)חיפוש פריטים עם תווית ספציפית
מחליפים את project_name.dataset_name בשם הפרויקט ובשם מערך הנתונים. מחליפים את label_id במזהה התווית, שאפשר למצוא במרכז ניהול התוויות.
השאילתה הזו מחזירה טבלה עם מזהה הקובץ, הכותרת, כתובת האימייל של הבעלים והסוג.
SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
SELECT 1
FROM UNNEST(applied_labels) AS label
WHERE label.id = label_id
)
איתור משתמשים שחורגים מסף השימוש בנפח האחסון ב-Drive
מחליפים את project_name.dataset_name בשם הפרויקט ובשם מערך הנתונים. מחליפים את threshold בסף הרצוי במגה-בייט. לדוגמה, כדי למצוא משתמשים שמשתמשים ביותר מ-15GB של אחסון ב-Drive, השורה הלפני האחרונה היא HAVING total_storage_mb > 15000.
השאילתה הזו מחזירה טבלה עם כתובת האימייל של המשתמש וסך השימוש בנפח האחסון ב-Drive ב-MB, בסדר יורד.
SELECT owner.user.email AS user_email,
SUM(size_bytes) / (1000000) AS total_storage_mb
FROM project_name.dataset_name
GROUP BY user_email
HAVING total_storage_mb > threshold
ORDER BY total_storage_mb DESC
איך מבררים אילו סוגי פריטים תופסים הכי הרבה מקום
מחליפים את project_name.dataset_name בשם הפרויקט ובשם מערך הנתונים.
השאילתה הזו מחזירה טבלה של סוגי פריטים לפי גודל בסדר יורד.
SELECT mime_type, SUM(consumed_quota_bytes) AS total_consumed
FROM project_name.dataset_name
GROUP BY mime_type
ORDER BY total_consumed DESC
חיפוש פריטים שהוצפנו באמצעות הצפנה מצד הלקוח (CSE)
מחליפים את project_name.dataset_name בשם הפרויקט ובשם מערך הנתונים.
SELECT id, owner.user.email, title
FROM project_name.dataset_name
WHERE mime_type LIKE '%.encrypted'
חיפוש פריטים ששותפו עם משתמש ספציפי
מחליפים את project_name.dataset_name בשם הפרויקט ובשם מערך הנתונים. מחליפים את user@example.com במשתמש הספציפי.
הערה: השאילתה הזו לא מוצאת שיתוף של המשתמש דרך קבוצות או חברות בקהל יעד.
SELECT id, title, mime_type, owner.user.email as owner_email
FROM project_name.dataset_name
WHERE EXISTS (
SELECT 1
FROM UNNEST(access.permissions) AS permissions
WHERE permissions.email = user@example.com
)
חיפוש פריטים לפי שמות של תיקיות אחסון שיתופי
מחליפים את project_name.dataset_name בשם הפרויקט ובשם מערך הנתונים.
השאילתה הזו מחזירה טבלה עם שם הפריט ב-Drive ושם האחסון השיתופי.
SELECT i.title, s.name
FROM project_name.dataset_name.inventory AS i
JOIN project_name.dataset_name.shared_drives AS s
ON i.owner.shared_drive.id = s.shared_drive_id;
חיפוש מספר הפריטים באחסון שיתופי
מחליפים את project_name.dataset_name בשם הפרויקט ובשם מערך הנתונים.
השאילתה הזו מחזירה טבלה עם שם האחסון השיתופי ומספר הפריטים.
SELECT s.name as shared_drive, count(*) as item_count
FROM project_name.dataset_name.inventory AS i
JOIN project_name.dataset_name.shared_drives AS s
ON i.owner.shared_drive.id = s.shared_drive_id
GROUP BY shared_drive;