Поддерживаемые версии для этой функции: Frontline Plus; Enterprise Standard и Enterprise Plus; Education Standard и Education Plus; Enterprise Essentials Plus; Cloud Identity Premium. Сравните вашу версию.
После настройки экспорта данных об использовании Google Диска вы можете проанализировать набор данных в BigQuery. На этой странице описана схема таблиц и примеры запросов для распространенных отчетов, которые можно получить из BigQuery.
Примечание: Вам необходимо настроить оплату для вашего проекта Google Cloud, поскольку экспорт и запрос данных из вашего хранилища Google Диска в BigQuery влечет за собой определенные расходы. Включите оплату для проекта .
Схема экспорта данных о запасах.
Схема и определения
Данные из архива Google Диска добавляются в набор данных BigQuery со следующей схемой:
| Имя | Поле схемы | Описание |
|---|---|---|
| Идентификатор товара | id | Уникальный идентификатор элемента в Google Диске. |
| Версия | version | Номер последней версии файла. Версия файла представляет собой монотонно возрастающее число. Это отражает все изменения, внесенные в файл на сервере, даже те, которые не видны пользователю. |
| Идентификатор владельца | owner.user.id | Для элементов, принадлежащих пользователю, указывается идентификатор пользователя, владеющего файлом. |
| Электронная почта владельца | owner.user.email | Для элементов, принадлежащих пользователю, указывается адрес электронной почты владельца файла. |
| Идентификатор общего диска | owner.shared_drive.id | Для элементов на общем диске используется идентификатор общего диска. |
| Создатель | creator | Адрес электронной почты и идентификатор пользователя создателя элемента. Это поле не заполняется, если создатель больше не имеет доступа к элементу. |
| Временные метки снимков | snapshot_start_time_micros и snapshot_end_time_micros | Временные метки начала и окончания генерации отчета. |
| Время чтения | read_time_micros | Отметка времени, когда были прочитаны метаданные элемента Google Диска. |
| Заголовок | title | Указанное пользователем название файла. |
| Описание | description | Краткое описание товара. |
| Статус "Утилизировано" | trashed | Была ли запись перемещена в корзину, но еще не удалена. |
| Тип MIME | mime_type | MIME-тип элемента. См. раздел «Поддерживаемые MIME-типы в Google Workspace и Google Drive». |
| Расширение файла | file_extension | Последняя составляющая полного расширения файла, извлекаемая из поля имени. Эта функция доступна только для элементов с двоичным содержимым в Google Диске. |
| Время сотворения | create_time_micros | Отметка времени создания элемента. |
| Время последнего изменения | last_modified_time_micros | Отметка времени последнего изменения данного элемента кем-либо. |
| Размер файла | file_size_bytes | Размер в байтах больших двоичных объектов и файлов редактора документов. Не отображается для элементов, размер которых не указан, таких как ярлыки и папки. |
| Использованная квота | consumed_quota_bytes | Количество байтов квоты хранения, используемых элементом. Сюда входит как исходная версия, так и предыдущие сохраненные версии. |
| Идентификатор общего диска | shared_drive_id | Для элементов на общем диске используется идентификатор общего диска. |
| Организационное подразделение | org_unit_path | Организационное подразделение владельца данного товара. |
| Контрольная сумма | md5_checksum | Контрольная сумма MD5 для содержимого элемента. |
| Шифрование на стороне клиента | client_side_encrypted | Логическое значение, указывающее, зашифрован ли элемент на стороне клиента . |
| Родительская папка | parent | Идентификатор родительской папки для элемента. |
| Наклеенные этикетки* | applied_labels.id | Идентификатор этикетки, присвоенной товару. |
applied_labels.title | Название ресурса метки, присвоенной элементу. | |
applied_labels.field_values.id | Идентификатор поля, уникальный в пределах метки или библиотеки. | |
| Тип поля. Может принимать одно из следующих значений: | |
| Текст, отображаемый в пользовательском интерфейсе для идентификации поля. | |
| Идентификатор цели ярлыка | shortcut_target_id | Идентификатор файла или папки, на которую указывает этот ярлык. |
| Разрешения | access.permissions.permission_id | Идентификатор данного разрешения. Это уникальный идентификатор получателя гранта. Примечание: Идентификатор разрешения не совпадает с идентификатором пользователя. |
access.permissions.name | Красивое название значения разрешения. Ниже приведён список примеров для каждого типа разрешения:
| |
access.permissions.type | Тип разрешения. Допустимые значения:
| |
access.permissions.role | Роль, предоставляемая данным разрешением. Допустимые значения:
Примечание: Подробную информацию о типе см. в разделе «Роли и разрешения» . | |
access.permissions.view | Если разрешение относится к представлению, значение | |
| Позволяет ли разрешение осуществлять поиск по файлу. Сообщается только для разрешений типа domain или anyone . | |
access.permissions.email | Адрес электронной почты пользователя или группы, к которым относится данное разрешение. | |
access.permissions.domain | Доменное имя сущности, на которую ссылается это разрешение. Оно присутствует, если тип разрешения — user , group или domain . | |
access.permissions.user_id | Идентификатор пользователя, связанный с адресом электронной почты в настройках разрешений. | |
access.permissions.permission_details | Тип прав доступа для пользователя. | |
access.permissions.permission_details.role | Основная роль пользователя. | |
access.permissions.permission_details | Идентификатор элемента, от которого наследуется это разрешение. Это поле заполняется только для элементов на общих дисках. | |
access.permissions.permission_details | Логическое значение, указывающее, наследуется ли разрешение. | |
access.permissions.inherited_permissions | Отключать ли унаследованные разрешения для этого элемента. Это справедливо только для папок с ограниченным доступом. |
* Относится к меткам, присвоенным элементам в Google Диске .
Примеры запросов
В этих примерах запросов предполагается использование устаревшего SQL. Замените project_name.dataset_name на имя вашего проекта и имя набора данных. Узнайте больше о запросах к данным BigQuery .
Находите элементы, которые можно найти с помощью поиска по Google Диску.
Замените project_name.dataset_name на название вашего проекта и название набора данных.
Возвращает таблицу, содержащую идентификатор файла, название, адрес электронной почты владельца и тип.
SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
SELECT 1
FROM UNNEST(access.permissions) AS permission
WHERE permission.allow_file_discovery = true
)Найти товары с определенной меткой
Замените project_name.dataset_name на название вашего проекта и название набора данных. Замените label_id на идентификатор вашей метки, который можно получить в менеджере меток .
Этот запрос возвращает таблицу, содержащую идентификатор файла, название, адрес электронной почты владельца и тип.
SELECT id, title, mime_type, owner.user.email
FROM project_name.dataset_name
WHERE EXISTS (
SELECT 1
FROM UNNEST(applied_labels) AS label
WHERE label.id = label_id
)
Найдите пользователей, у которых объем используемого хранилища Google Диск превышает установленный порог.
Замените project_name.dataset_name на имя вашего проекта и имя набора данных. Замените threshold на ваш пороговый уровень в МБ. Например, чтобы найти пользователей, использующих более 15 ГБ хранилища Google Диска, предпоследняя строка будет выглядеть так: HAVING total_storage_mb > 15000 .
Этот запрос возвращает таблицу с адресами электронной почты пользователей и общим объемом используемого дискового пространства в МБ в порядке убывания.
SELECT owner.user.email AS user_email,
SUM(size_bytes) / (1000000) AS total_storage_mb
FROM project_name.dataset_name
GROUP BY user_email
HAVING total_storage_mb > threshold
ORDER BY total_storage_mb DESC
Определите, какие типы предметов занимают больше всего места.
Замените project_name.dataset_name на название вашего проекта и название набора данных.
Этот запрос возвращает таблицу типов элементов, отсортированных по убыванию размера.
SELECT mime_type, SUM(consumed_quota_bytes) AS total_consumed
FROM project_name.dataset_name
GROUP BY mime_type
ORDER BY total_consumed DESC
Найти элементы, зашифрованные с помощью клиентского шифрования (CSE).
Замените project_name.dataset_name на название вашего проекта и название набора данных.
SELECT id, owner.user.email, title
FROM project_name.dataset_name
WHERE mime_type LIKE '%.encrypted'
Найти элементы, которыми поделился конкретный пользователь.
Замените project_name.dataset_name на название вашего проекта и название набора данных. Замените user@example.com на имя вашего конкретного пользователя.
Примечание: Этот запрос не находит информацию о возможности поделиться контентом с пользователем через группы или членство в целевой аудитории.
SELECT id, title, mime_type, owner.user.email as owner_email
FROM project_name.dataset_name
WHERE EXISTS (
SELECT 1
FROM UNNEST(access.permissions) AS permissions
WHERE permissions.email = user@example.com
)