Schema- och exempelfrågor för export av Drive-lager i BigQuery

Utgåvor som stöds för den här funktionen: Frontline Plus; Enterprise Standard och Enterprise Plus; Education Standard och Education Plus; Enterprise Essentials Plus; Cloud Identity Premium. Jämför din utgåva

När du har konfigurerat export av Drive-lager kan du analysera datamängden i BigQuery. Den här sidan beskriver tabellschemat och exempelfrågor för vanliga rapporter du kan hämta från BigQuery.

Obs! Du måste konfigurera fakturering för ditt Google Cloud-projekt eftersom det kostar att exportera och fråga efter ditt Drive-annonsutrymme i BigQuery. Aktivera fakturering för ett projekt .

Schema för export av Drive-annonsutrymme

Schema och definitioner

Exporten av Drive-inventariet läggs till i BigQuery-datasetet med följande schema:

Namn Schemafält Beskrivning
Artikel-ID id Objektets unika Drive-objektidentifierare.
Version version Filens senaste versionsnummer. Filversionen är ett monotont ökande nummer. Detta återspeglar alla ändringar som gjorts i filen på servern, även de som inte är synliga för användaren.

Ägare

owner.user.id

För objekt som ägs av en användare, användar-ID för filägaren.

owner.user.email

För objekt som ägs av en användare, filägarens e-postadress.

owner.shared_drive.id

För objekt på en delad enhet, den delade enhetens ID.

Skapare creator E-postadress och användar-ID för objektets skapare. Det här fältet fylls inte i om skaparen inte längre har åtkomst till objektet.
Tidsstämplar för ögonblicksbilder snapshot_start_time_micros och snapshot_end_time_micros Tidsstämplarna för när rapportgenereringen startade och slutade.
Lästid read_time_micros Tidsstämpeln för när Drive-objektets metadata lästes.
Titel title

Den användardefinierade filtiteln.

Beskrivning description En kort beskrivning av varan.
Status för papperskorgen trashed Huruvida objektet flyttades till papperskorgen men ännu inte raderades.
Mime-typ mime_type Objektets MIME-typ. Se vilka MIME-typer som stöds av Google Workspace och Google Drive.
Filändelse file_extension Den sista komponenten i den fullständiga filändelsen, som extraheras från namnfältet. Detta är endast tillgängligt för objekt med binärt innehåll i Google Drive.
Skapandetid create_time_micros Tidsstämpeln för när objektet skapades.
Senast ändrad tid last_modified_time_micros Tidsstämpeln för den senaste gången objektet ändrades av någon.
Storleksbyte size_bytes Storleken i byte på blobs och Docs Editors-filer. Rapporteras inte för objekt som saknar storlek, som genvägar och mappar.
Förbrukad kvot consumed_quota_bytes Antalet lagringskvotbyte som används av objektet. Detta inkluderar huvudrevisionen samt tidigare revisioner som har sparats.
Organisationsenhet org_unit_path Objektets ägares organisationsenhet.
Kontrollsumma md5_checksum MD5-kontrollsumman för innehållet i objektet.
Klientsidans kryptering client_side_encrypted Ett booleskt värde som anger om objektet är krypterat på klientsidan .
Överordnad mapp parent ID:t för den överordnade mappen för objektet.

Överordnad mapp kommer inte att fyllas i i följande fall:

  1. Filen är överordnad i en användares översta mapp på Min enhet.
  2. Den överordnade mappen ägs inte av domänen.
Tillämpade etiketter* applied_labels.id ID:t för etiketten som tillämpats på artikeln.
applied_labels.title Resursnamnet på den etikett som tillämpats på objektet.
applied_labels.field_values.id

ID för ett fält, unikt inom en etikett eller ett bibliotek.

applied_labels.field_values.type

Fälttypen. Kan vara ett av följande:

applied_labels.field_values.display_name

Texten som ska visas i användargränssnittet som identifierar fältet.
Genvägsmål-ID shortcut_target_id ID:t för filen eller mappen som genvägen pekar till.
Behörigheter access.permissions.permission_id

ID för denna behörighet. Detta är en unik identifierare för behörighetstagaren.

Obs: Behörighets-ID:t är inte detsamma som användar-ID:t.

access.permissions.name

Det "snygga" namnet på behörighetens värde. Följande är en lista med exempel för varje typ av behörighet:

  • user – Användarens fullständiga namn, som det definierats för deras Google-konto, till exempel "Dana Cruz"
  • group - Namn på gruppen, till exempel "Exempeladministratörer"
  • domain - Strängdomännamn, till exempel "example.com"
  • anyone - Inget namn angivet
access.permissions.type

Typ av behörighet. Giltiga värden är:

  • user
  • group
  • domain
  • anyone
access.permissions.role

Rollen som beviljas av denna behörighet. Giltiga värden är:

  • owner
  • organizer
  • fileOrganizer
  • writer
  • commenter
  • reader

Obs: Se roller och behörigheter för mer information om typen.

access.permissions.view

Om behörigheten tillhör en vy published värdet.

access.permissions.allow_file_discovery

Om behörigheten tillåter att filen är sökbar. Rapporteras endast för behörigheter av typen domain eller anyone .
access.permissions.email E-postadressen för den användare eller grupp som denna behörighet avser.
access.permissions.domain Domännamnet för den enhet som denna behörighet hänvisar till. Detta finns när behörighetstypen är user , group eller domain .
access.permissions.user_id Användar-ID:t som är kopplat till e-postadressen för behörigheterna.
access.permissions.permission_details
.permission_type
Behörighetstypen för användaren.
access.permissions.permission_details.role Den primära rollen för användaren.
access.permissions.permission_details
.inherited_from
ID:t för det objekt som denna behörighet ärvs från. Detta fylls endast i för objekt på delade enheter.
access.permissions.permission_details
.inherited
Ett booleskt värde som anger om behörigheten ärvs.
access.permissions.inherited_permissions
_disabled
Om ärvda behörigheter är inaktiverade för det här objektet. Gäller endast för mappar med begränsad åtkomst.

* Avser etiketter som tillämpats på objekt i Drive .

Schema för delade enheter

Tabell för delade enheter

Tabellen beskriver schemat för fält specifika för delade enheter i Drive-inventeringsexporten.

Namn Schemafält Beskrivning
Delad enhets-ID shared_drive_id Den unika identifieraren för den delade enheten.
Namn på delad enhet name Namnet på den delade enheten, som det anges av användaren.
Lästid read_time_micros Tidsstämpeln för när metadata för den delade enheten lästes, i mikrosekunder.

Exempel på frågor

Dessa frågeexempel förutsätter äldre SQL. Läs mer om att fråga BigQuery-data .

Ersätt project_name.dataset_name med ditt projektnamn och datasetnamn.

Den här frågan returnerar en tabell med fil-ID, titel, ägarens e-postadress och typ.

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permission
  WHERE permission.allow_file_discovery = true
)

Hitta artiklar med en specifik etikett

Ersätt project_name.dataset_name med ditt projektnamn och datasetnamn. Ersätt label_id med ditt etikett-ID, som du kan hämta i etiketthanteraren .

Den här frågan returnerar en tabell med fil-ID, titel, ägarens e-postadress och typ.

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(applied_labels) AS label
  WHERE label.id = label_id
)

Hitta användare som överskrider en tröskel för lagringsanvändning på Drive

Ersätt project_name.dataset_name med ditt projektnamn och datasetnamn. Ersätt threshold med din tröskel i MB. För att till exempel hitta användare med över 15 GB Drive-lagringsutrymme är den näst sista raden HAVING total_storage_mb > 15000 .

Den här frågan returnerar en tabell över användarens e-postadress och total Drive-lagringsanvändning i MB i fallande ordning.

SELECT owner.user.email AS user_email,
  SUM(size_bytes) / (1000000) AS total_storage_mb
FROM project_name.dataset_name
GROUP BY user_email
HAVING total_storage_mb > threshold
ORDER BY total_storage_mb DESC

Hitta vilka objekttyper som använder mest utrymme

Ersätt project_name.dataset_name med ditt projektnamn och datasetnamn.

Den här frågan returnerar en tabell med objekttyper i fallande storlek.

SELECT mime_type, SUM(consumed_quota_bytes) AS total_consumed
FROM project_name.dataset_name
GROUP BY mime_type
ORDER BY total_consumed DESC

Hitta objekt krypterade med klientsideskryptering (CSE)

Ersätt project_name.dataset_name med ditt projektnamn och datasetnamn.

SELECT id, owner.user.email, title
FROM project_name.dataset_name
WHERE mime_type LIKE '%.encrypted'

Hitta objekt som delats med en specifik användare

Ersätt project_name.dataset_name med ditt projektnamn och datasetnamn. Ersätt user@example.com med din specifika användare.

Obs! Den här frågan hittar inte delning för användaren via grupper eller målgruppsmedlemskap.

SELECT id, title, mime_type, owner.user.email as owner_email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permissions
  WHERE permissions.email = user@example.com
)

Hitta objekt med namn på delade enheter

Ersätt project_name.dataset_name med ditt projektnamn och datasetnamn.

Den här frågan returnerar en tabell med Drive-objektets titel och det delade enhetens namn.

SELECT i.title, s.name
FROM project_name.dataset_name.inventory AS i
JOIN project_name.dataset_name.shared_drives AS s
ON i.owner.shared_drive.id = s.shared_drive_id;

Hitta antal objekt i delad enhet

Ersätt project_name.dataset_name med ditt projektnamn och datasetnamn.

Den här frågan returnerar en tabell med namn på delad enhet och antal objekt.

SELECT  s.name as shared_drive, count(*) as item_count
FROM project_name.dataset_name.inventory AS i
JOIN project_name.dataset_name.shared_drives AS s
ON i.owner.shared_drive.id = s.shared_drive_id
GROUP BY shared_drive;