Schema e query di esempio per le esportazioni dell'inventario di Drive in BigQuery

Versioni supportate per questa funzionalità: Frontline Plus; Enterprise Standard ed Enterprise Plus; Education Standard ed Education Plus; Enterprise Essentials Plus; Cloud Identity Premium. Confronta la tua versione

Dopo aver configurato le esportazioni dell'inventario di Drive, puoi analizzare il set di dati in BigQuery. Questa pagina descrive lo schema della tabella e le query di esempio per i report comuni che puoi ottenere da BigQuery.

Nota:devi configurare la fatturazione per il tuo progetto Google Cloud perché l'esportazione e l'esecuzione di query sull'inventario di Drive in BigQuery hanno un costo. Abilitare la fatturazione per un progetto.

Schema di esportazione dell'inventario di Drive

Schema e definizioni

L'esportazione dell'inventario di Drive viene aggiunta al set di dati BigQuery con lo schema seguente:

Nome Campo Schema Descrizione
ID articolo id L'identificatore univoco dell'elemento di Drive.
Versione version Il numero dell'ultima versione del file. La versione del file viene indicata da un numero che aumenta monotonicamente. Questo riflette ogni modifica apportata al file sul server, anche quelle non visibili all'utente.
ID proprietario owner.user.id

Per gli elementi di proprietà di un utente, l'ID utente del proprietario del file.

Email proprietario owner.user.email Per gli elementi di proprietà di un utente, l'indirizzo email del proprietario del file.
ID Drive condiviso owner.shared_drive.id Per gli elementi in un Drive condiviso, l'ID del Drive condiviso.
Autore creator L'indirizzo email e l'ID utente del creator dell'elemento. Questo campo non viene compilato se il creator non ha più accesso all'elemento.
Timestamp degli snapshot snapshot_start_time_micros e snapshot_end_time_micros Timestamp di inizio e fine della generazione del report.
Tempo di lettura read_time_micros Il timestamp del momento in cui sono stati letti i metadati dell'elemento Drive.
Titolo title

Il titolo del file specificato dall'utente.

Descrizione description Una breve descrizione dell'elemento.
Stato "Spostato nel cestino" trashed Se l'elemento è stato spostato nel cestino, ma non ancora eliminato.
Tipo MIME mime_type Il tipo MIME dell'elemento. Vedi i tipi MIME supportati per Google Workspace e Google Drive.
Estensione del file file_extension Il componente finale dell'estensione completa del file, che viene estratto dal campo nome. Disponibile solo per gli elementi con contenuti binari su Google Drive.
Ora creazione create_time_micros Il timestamp della creazione dell'elemento.
Ora dell'ultima modifica last_modified_time_micros Timestamp dell'ultima modifica dell'elemento da parte di un utente.
Dimensioni file file_size_bytes Le dimensioni in byte dei blob e dei file degli editor di documenti. Non vengono segnalate per gli elementi senza dimensioni, come scorciatoie e cartelle.
Quota utilizzata consumed_quota_bytes Il numero di byte della quota di spazio di archiviazione utilizzati dall'elemento. Ciò include la revisione principale e le revisioni precedenti che sono state conservate.
ID Drive condiviso shared_drive_id Per gli elementi in un Drive condiviso, l'ID del Drive condiviso.
Unità organizzativa org_unit_path L'unità organizzativa del proprietario dell'elemento.
Checksum md5_checksum Il checksum MD5 per i contenuti dell'elemento.
Crittografia lato client client_side_encrypted Un valore booleano che indica se l'elemento è criptato lato client .
Cartella padre parent L'ID della cartella principale dell'elemento.
Etichette applicate* applied_labels.id L'ID dell'etichetta applicata all'elemento.
applied_labels.title Il nome della risorsa dell'etichetta applicata all'elemento.
applied_labels.field_values.id

L'ID di un campo, univoco all'interno di un'etichetta o di una raccolta.

applied_labels.field_values.type

Il tipo di campo. Può corrispondere a uno dei seguenti:

applied_labels.field_values.display_name

Il testo da mostrare nell'interfaccia utente che identifica il campo.
ID destinazione scorciatoia shortcut_target_id L'ID del file o della cartella a cui punta questa scorciatoia.
Autorizzazioni access.permissions.permission_id

L'ID di questa autorizzazione. Si tratta di un identificatore unico per il beneficiario.

Nota: l'ID autorizzazione non corrisponde all'ID utente.

access.permissions.name

Il nome "pretty" del valore dell'autorizzazione. Di seguito è riportato un elenco di esempi per ciascun tipo di autorizzazione:

  • user: nome completo dell'utente, come definito per il suo Account Google, ad esempio "Mario Rossi".
  • group: nome del gruppo, ad esempio "Amministratori di esempio"
  • domain: nome di dominio della stringa, ad esempio "example.com".
  • anyone - Nessun nome indicato
access.permissions.type

Il tipo di autorizzazione. I valori validi sono:

  • user
  • group
  • domain
  • anyone
access.permissions.role

Il ruolo concesso da questa autorizzazione. I valori validi sono:

  • owner
  • organizer
  • fileOrganizer
  • writer
  • commenter
  • reader

Nota: consulta la sezione Ruoli e autorizzazioni per maggiori dettagli sul tipo.

access.permissions.view

Se l'autorizzazione appartiene a una vista, il valore è published.

access.permissions.allow_file_discovery

Indica se l'autorizzazione consente di rendere il file disponibile per la ricerca. Segnalato solo per le autorizzazioni di tipo domain o anyone.
access.permissions.email L'indirizzo email dell'utente o del gruppo a cui fa riferimento questa autorizzazione.
access.permissions.domain Il nome di dominio dell'entità a cui fa riferimento questa autorizzazione. È presente quando l'autorizzazione è di tipo user, group o domain.
access.permissions.user_id L'ID utente associato all'email nelle autorizzazioni.
access.permissions.permission_details
.permission_type
Il tipo di autorizzazione per l'utente.
access.permissions.permission_details.role Il ruolo principale dell'utente.
access.permissions.permission_details
.inherited_from
L'ID dell'elemento da cui viene ereditata questa autorizzazione. Questo campo viene compilato solo per gli elementi dei Drive condivisi.
access.permissions.permission_details
.inherited
Un valore booleano che indica se l'autorizzazione è ereditata.
access.permissions.inherited_permissions
_disabled
Indica se le autorizzazioni ereditate sono disattivate per questo elemento. Solo per le cartelle con accesso limitato.

* Si riferisce alle etichette applicate agli elementi di Drive.

Esempi di query

Questi esempi di query presuppongono il dialetto SQL precedente. Sostituisci project_name.dataset_name con il nome del tuo progetto e quello del set di dati. Scopri di più sull'esecuzione di query dei dati di BigQuery.

Sostituisci project_name.dataset_name con il nome del tuo progetto e quello del set di dati.

Restituisce una tabella con titolo, indirizzo email del proprietario, tipo e ID file.

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permission
  WHERE permission.allow_file_discovery = true
)

Trovare gli elementi con un'etichetta specifica

Sostituisci project_name.dataset_name con il nome del tuo progetto e quello del set di dati. Sostituisci label_id con l'ID etichetta, che puoi trovare nel Gestore etichette.

Questa query restituisce una tabella con titolo, indirizzo email del proprietario, tipo e ID file.

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(applied_labels) AS label
  WHERE label.id = label_id
)

Trovare gli utenti che superano una soglia di utilizzo dello spazio di archiviazione di Drive

Sostituisci project_name.dataset_name con il nome del tuo progetto e quello del set di dati. Sostituisci threshold con la soglia in MB. Ad esempio, per trovare gli utenti con più di 15 GB di utilizzo dello spazio di archiviazione di Drive, la penultima riga è HAVING total_storage_mb > 15000.

Questa query restituisce un indirizzo email utente e l'utilizzo totale dello spazio di archiviazione di Drive in MB in ordine decrescente.

SELECT owner.user.email AS user_email,
  SUM(size_bytes) / (1000000) AS total_storage_mb
FROM project_name.dataset_name
GROUP BY user_email
HAVING total_storage_mb > threshold
ORDER BY total_storage_mb DESC

Scopri quali tipi di elementi occupano più spazio

Sostituisci project_name.dataset_name con il nome del tuo progetto e quello del set di dati.

Questa query restituisce una tabella dei tipi di elementi in ordine decrescente di dimensione.

SELECT mime_type, SUM(consumed_quota_bytes) AS total_consumed
FROM project_name.dataset_name
GROUP BY mime_type
ORDER BY total_consumed DESC

Trovare gli elementi criptati con crittografia lato client

Sostituisci project_name.dataset_name con il nome del tuo progetto e quello del set di dati.

SELECT id, owner.user.email, title
FROM project_name.dataset_name
WHERE mime_type LIKE '%.encrypted'

Trovare gli elementi condivisi con un utente specifico

Sostituisci project_name.dataset_name con il nome del tuo progetto e quello del set di dati. Sostituisci user@example.com con l'utente specifico.

Nota:questa query non trova la condivisione per l'utente tramite l'appartenenza a gruppi o al pubblico di destinazione.

SELECT id, title, mime_type, owner.user.email as owner_email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permissions
  WHERE permissions.email = user@example.com
)