Схема и примеры запросов для экспорта данных об автомобилях в BigQuery.

Поддерживаемые версии для этой функции: Frontline Plus; Enterprise Standard и Enterprise Plus; Education Standard и Education Plus; Enterprise Essentials Plus; Cloud Identity Premium. Сравните вашу версию.

После настройки экспорта данных об использовании Google Диска вы можете проанализировать набор данных в BigQuery. На этой странице описана схема таблиц и примеры запросов для распространенных отчетов, которые можно получить из BigQuery.

Примечание: Вам необходимо настроить оплату для вашего проекта Google Cloud, поскольку экспорт и запрос данных из вашего хранилища Google Диска в BigQuery влечет за собой определенные расходы. Включите оплату для проекта .

Схема экспорта данных о запасах.

Схема и определения

Данные из архива Google Диска добавляются в набор данных BigQuery со следующей схемой:

Имя Поле схемы Описание
Идентификатор товара id Уникальный идентификатор элемента в Google Диске.
Версия version Номер последней версии файла. Версия файла представляет собой монотонно возрастающее число. Это отражает все изменения, внесенные в файл на сервере, даже те, которые не видны пользователю.
Идентификатор владельца owner.user.id

Для элементов, принадлежащих пользователю, указывается идентификатор пользователя, владеющего файлом.

Электронная почта владельца owner.user.email Для элементов, принадлежащих пользователю, указывается адрес электронной почты владельца файла.
Идентификатор общего диска owner.shared_drive.id Для элементов на общем диске используется идентификатор общего диска.
Создатель creator Адрес электронной почты и идентификатор пользователя создателя элемента. Это поле не заполняется, если создатель больше не имеет доступа к элементу.
Временные метки снимков snapshot_start_time_micros и snapshot_end_time_micros Временные метки начала и окончания генерации отчета.
Время чтения read_time_micros Отметка времени, когда были прочитаны метаданные элемента Google Диска.
Заголовок title

Указанное пользователем название файла.

Описание description Краткое описание товара.
Статус "Утилизировано" trashed Была ли запись перемещена в корзину, но еще не удалена.
Тип MIME mime_type MIME-тип элемента. См. раздел «Поддерживаемые MIME-типы в Google Workspace и Google Drive».
Расширение файла file_extension Последняя составляющая полного расширения файла, извлекаемая из поля имени. Эта функция доступна только для элементов с двоичным содержимым в Google Диске.
Время сотворения create_time_micros Отметка времени создания элемента.
Время последнего изменения last_modified_time_micros Отметка времени последнего изменения данного элемента кем-либо.
Размер файла file_size_bytes Размер в байтах больших двоичных объектов и файлов редактора документов. Не отображается для элементов, размер которых не указан, таких как ярлыки и папки.
Использованная квота consumed_quota_bytes Количество байтов квоты хранения, используемых элементом. Сюда входит как исходная версия, так и предыдущие сохраненные версии.
Идентификатор общего диска shared_drive_id Для элементов на общем диске используется идентификатор общего диска.
Организационное подразделение org_unit_path Организационное подразделение владельца данного товара.
Контрольная сумма md5_checksum Контрольная сумма MD5 для содержимого элемента.
Шифрование на стороне клиента client_side_encrypted Логическое значение, указывающее, зашифрован ли элемент на стороне клиента .
Родительская папка parent Идентификатор родительской папки для элемента.
Наклеенные этикетки* applied_labels.id Идентификатор этикетки, присвоенной товару.
applied_labels.title Название ресурса метки, присвоенной элементу.
applied_labels.field_values.id

Идентификатор поля, уникальный в пределах метки или библиотеки.

applied_labels.field_values.type

Тип поля. Может принимать одно из следующих значений:

applied_labels.field_values.display_name

Текст, отображаемый в пользовательском интерфейсе для идентификации поля.
Идентификатор цели ярлыка shortcut_target_id Идентификатор файла или папки, на которую указывает этот ярлык.
Разрешения access.permissions.permission_id

Идентификатор данного разрешения. Это уникальный идентификатор получателя гранта.

Примечание: Идентификатор разрешения не совпадает с идентификатором пользователя.

access.permissions.name

Красивое название значения разрешения. Ниже приведён список примеров для каждого типа разрешения:

  • user — Полное имя пользователя, указанное в его учетной записи Google, например, «Dana Cruz».
  • group — название группы, например, «Примеры администраторов»
  • domain - строковое имя домена, например, "example.com"
  • anyone - Имя не указано
access.permissions.type

Тип разрешения. Допустимые значения:

  • user
  • group
  • domain
  • anyone
access.permissions.role

Роль, предоставляемая данным разрешением. Допустимые значения:

  • owner
  • organizer
  • fileOrganizer
  • writer
  • commenter
  • reader

Примечание: Подробную информацию о типе см. в разделе «Роли и разрешения» .

access.permissions.view

Если разрешение относится к представлению, значение published .

access.permissions.allow_file_discovery

Позволяет ли разрешение осуществлять поиск по файлу. Сообщается только для разрешений типа domain или anyone .
access.permissions.email Адрес электронной почты пользователя или группы, к которым относится данное разрешение.
access.permissions.domain Доменное имя сущности, на которую ссылается это разрешение. Оно присутствует, если тип разрешения — user , group или domain .
access.permissions.user_id Идентификатор пользователя, связанный с адресом электронной почты в настройках разрешений.
access.permissions.permission_details
.permission_type
Тип прав доступа для пользователя.
access.permissions.permission_details.role Основная роль пользователя.
access.permissions.permission_details
.inherited_from
Идентификатор элемента, от которого наследуется это разрешение. Это поле заполняется только для элементов на общих дисках.
access.permissions.permission_details
.inherited
Логическое значение, указывающее, наследуется ли разрешение.
access.permissions.inherited_permissions
_disabled
Отключать ли унаследованные разрешения для этого элемента. Это справедливо только для папок с ограниченным доступом.

* Относится к меткам, присвоенным элементам в Google Диске .

Примеры запросов

В этих примерах запросов предполагается использование устаревшего SQL. Замените project_name.dataset_name на имя вашего проекта и имя набора данных. Узнайте больше о запросах к данным BigQuery .

Замените project_name.dataset_name на название вашего проекта и название набора данных.

Возвращает таблицу, содержащую идентификатор файла, название, адрес электронной почты владельца и тип.

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permission
  WHERE permission.allow_file_discovery = true
)

Найти товары с определенной меткой

Замените project_name.dataset_name на название вашего проекта и название набора данных. Замените label_id на идентификатор вашей метки, который можно получить в менеджере меток .

Этот запрос возвращает таблицу, содержащую идентификатор файла, название, адрес электронной почты владельца и тип.

SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(applied_labels) AS label
  WHERE label.id = label_id
)

Найдите пользователей, у которых объем используемого хранилища Google Диск превышает установленный порог.

Замените project_name.dataset_name на имя вашего проекта и имя набора данных. Замените threshold на ваш пороговый уровень в МБ. Например, чтобы найти пользователей, использующих более 15 ГБ хранилища Google Диска, предпоследняя строка будет выглядеть так: HAVING total_storage_mb > 15000 .

Этот запрос возвращает таблицу с адресами электронной почты пользователей и общим объемом используемого дискового пространства в МБ в порядке убывания.

SELECT owner.user.email AS user_email,
  SUM(size_bytes) / (1000000) AS total_storage_mb
FROM project_name.dataset_name
GROUP BY user_email
HAVING total_storage_mb > threshold
ORDER BY total_storage_mb DESC

Определите, какие типы предметов занимают больше всего места.

Замените project_name.dataset_name на название вашего проекта и название набора данных.

Этот запрос возвращает таблицу типов элементов, отсортированных по убыванию размера.

SELECT mime_type, SUM(consumed_quota_bytes) AS total_consumed
FROM project_name.dataset_name
GROUP BY mime_type
ORDER BY total_consumed DESC

Найти элементы, зашифрованные с помощью клиентского шифрования (CSE).

Замените project_name.dataset_name на название вашего проекта и название набора данных.

SELECT id, owner.user.email, title
FROM project_name.dataset_name
WHERE mime_type LIKE '%.encrypted'

Найти элементы, которыми поделился конкретный пользователь.

Замените project_name.dataset_name на название вашего проекта и название набора данных. Замените user@example.com на имя вашего конкретного пользователя.

Примечание: Этот запрос не находит информацию о возможности поделиться контентом с пользователем через группы или членство в целевой аудитории.

SELECT id, title, mime_type, owner.user.email as owner_email
FROM project_name.dataset_name
WHERE EXISTS (
  SELECT 1
  FROM UNNEST(access.permissions) AS permissions
  WHERE permissions.email = user@example.com
)