활동 로그 이벤트 (사용자가 수행한 단일 작업) 및 사용 보고서 (앱에 대한 종합 보고서)를 Google BigQuery로 내보내려면 Google 관리 콘솔에서 BigQuery Export 구성을 설정해야 합니다.
BigQuery 및 Reports API 데이터에 대한 정보
BigQuery 데이터 세트에서 사용할 수 있는 데이터는 Reports API에서 검색한 데이터와 다릅니다. BigQuery 데이터에는 필터링되지 않은 데이터 세트만 포함됩니다. SQL을 사용하여 데이터를 필터링할 수는 있지만, Reports API 매개변수 중 일부는 지원되지 않습니다.
API 요청에 매개변수를 포함하여 Reports API 데이터를 필터링할 수 있습니다.
예: 도메인에 A와 B라는 두 개의 조직 단위가 있는 경우, Reports API 및 BigQuery를 사용하여 전체 도메인 (A 및 B)의 모든 이벤트에 액세스할 수 있습니다.
- 하지만 Reports API를 사용하면 API 요청에 orgUnitID 매개변수를 사용하여 A 이벤트를 검색할 수 있습니다.
- SQL 및 BigQuery를 사용하면 orgUnitID 매개변수에 해당하는 열이 없으므로 조직 단위별로 이벤트를 필터링할 수 없습니다.
중요:
- BigQuery 데이터에는 이전 데이터 (활동 데이터의 경우 180일, 사용 데이터의 경우 450일)가 포함됩니다. Reports API에서 이전 데이터를 검색할 수도 있습니다.
- 'Google Workspace 데이터 BigQuery로 내보내기'를 사용 중지하는 경우 BigQuery Export에는 새 데이터가 포함되지 않습니다. 그러나 기존 데이터는 Reports API 등의 다른 소스에서 사용할 수 있습니다.
- BigQuery 테이블에는 유사 열 (_PARTITIONTIME)에 일별 파티션이 있습니다. 이러한 파티션은 활동 테이블의 time_usec 열과 사용 테이블의 date 열에서 파생됩니다. 특히 Workspace는 파티션을 태평양 시간 (PT)에 맞추기 위해 기본 BigQuery UTC 경계를 재정의합니다. BigQuery 쿼리 비용을 최적화하려면 time_usec 또는 date와 함께 _PARTITIONTIME으로 필터링하는 것이 좋습니다.
- 일부 서비스 보고서 데이터는 BigQuery Export에서 사용할 수 없습니다. 지원되는 서비스 목록은 이 페이지의 BigQuery Export는 어떤 서비스를 지원하나요?를 참고하세요.
- 쿼리 예시는 BigQuery의 보고서 로그 쿼리 예를 참고하세요.
데이터 적용 및 보관 방법
- 정책이 적용되는 데는 1시간 정도 소요될 수 있으며 적용 후 데이터 세트에 일일 테이블이 생성됩니다 (태평양 표준시 기준).
- 데이터는 다른 로그 및 보고서에 대한 가이드라인에 따라 저장됩니다. 자세한 내용은 데이터 보관 및 지연 시간을 참고하세요.
- 데이터 테이블은 자동으로 삭제되지 않습니다. 활성 프로젝트를 삭제하려면 BigQuery Export 구성 삭제하기로 이동하세요.
- 활동 로그 이벤트는 10분 이내에 사용할 수 있습니다. 초기 구성에서는 사용 로그 이벤트가 48시간 지연되지만 그 이후에는 일반적으로 1~3일이 지연됩니다.
시작하기 전에
중요: Google Cloud에서 도메인 제한 공유 조직 정책을 사용하는 경우 Google 고객 ID C02h8e9nw를 허용 목록에 추가해야 합니다.
먼저 Google Cloud 콘솔에서 BigQuery 프로젝트를 설정해야 합니다. 프로젝트를 만들 때 다음을 수행합니다.
- Google Workspace 관리자 계정을 다음과 같이 추가합니다.
- BigQuery 관리자 (roles/bigquery.admin) 또는 이에 상응하는 ID 및 액세스 관리 (IAM) 역할
- 프로젝트 IAM 관리자(roles/resourcemanager.projectIamAdmin)
- gapps-reports@system.gserviceaccount.com 서비스 계정을 프로젝트 편집자 (또는 이에 상응하는 IAM 편집자 역할)로 추가합니다. 이 계정은 로그 작성, 스키마 업데이트, 나중에 나오는 5단계 완료에 필요합니다.
자세한 내용은 보고서 로그용 BigQuery 프로젝트 설정하기를 참고하세요.
1단계: BigQuery Export 구성 설정하기
-
Google 관리 콘솔에서 메뉴
보고
데이터 통합 (또는 교육 관리자의 경우 BigQuery 내보내기)로 이동하여 데이터 통합 페이지를 엽니다.
보고서 관리자 권한이 필요합니다.
- BigQuery Export 카드를 가리킨 다음 수정
을 클릭합니다.
- BigQuery 로그를 활성화하려면 Google BigQuery로 Google Workspace 데이터 내보내기 사용 설정 체크박스를 선택합니다.
- (선택사항) DLP 규칙의 민감한 매개변수를 내보내려면 DLP 규칙 로그에서 민감한 콘텐츠 내보내기 허용 체크박스를 선택합니다. 자세한 내용은 DLP 규칙을 트리거하는 콘텐츠 보기를 참고하세요.
- BigQuery 프로젝트 ID에서 로그를 저장할 프로젝트를 선택합니다. gapps-reports@system.gserviceaccount.com에 편집자 역할 또는 이에 상응하는 IAM 편집자 역할이 있는 프로젝트를 선택합니다. 프로젝트가 표시되지 않으면 BigQuery에서 프로젝트를 설정해야 합니다. 자세한 내용은 Google Cloud 콘솔을 사용한 빠른 시작을 참고하세요.
- 프로젝트 내 새 데이터 세트에서 프로젝트의 로그 저장에 사용할 데이터 세트 이름을 입력합니다. 프로젝트마다 데이터 세트 이름이 달라야 합니다. 자세한 내용은 데이터 세트 만들기를 참고하세요.
- (선택사항) 데이터 세트를 특정 지리적 위치로 제한 체크박스를 선택하고
메뉴에서 위치를 선택합니다. 자세한 내용은 멀티 리전을 참고하세요.
- 저장을 클릭합니다. 참고: 프로젝트를 저장할 수 없으면 Google Cloud 콘솔로 이동하여 새 데이터 세트를 삭제한 다음 관리 콘솔에서 다시 저장하세요.
내보내기가 트리거된 다음날 데이터 세트가 생성됩니다. 프로젝트 소유자, 편집자, 뷰어뿐 아니라 gapps-reports@system.gserviceaccount.com 서비스 계정도 편집자로 추가됩니다. 이 서비스 계정은 로그 작성 및 스키마 업데이트에 필요합니다.
2단계: BigQuery Export 데이터 세트 변경 및 새 데이터 세트로 백필 (선택사항)
BigQuery Export 설정을 변경하여 현재 데이터 세트가 아닌 다른 데이터 세트로 데이터 내보내기를 시작할 수 있습니다. 이전 데이터 세트의 기존 데이터를 새로 선택한 데이터 세트로 이동할 수도 있습니다 (감사 180일, 사용 450일). 예를 들어 BigQuery Export 데이터 세트 위치를 미국에서 EU로 변경할 수 있습니다. 백필을 사용하면 미국 리전에 이미 저장된 데이터를 EU 리전으로 전송할 수 있습니다. 백필을 선택하면 BigQuery가 지정된 위치에 새 데이터 세트를 만듭니다.
고려사항
- 새 위치를 선택하거나 프로젝트 ID 또는 데이터 세트 ID를 변경하면 기존 데이터가 새 데이터 세트로 내보내집니다.
- 내보낸 데이터는 이전 데이터 세트에도 보관됩니다.
- 모든 새 데이터는 백필된 데이터와 함께 새 데이터 세트에 저장됩니다.
- 기존 데이터 (감사 180일, 사용 450일)는 새 데이터 세트로 내보내지지만 기존 위치에서 삭제되지 않으므로 두 위치에 BigQuery Export 데이터 세트가 있게 됩니다.
기존 데이터를 새 위치로 백필하는 방법은 다음과 같습니다.
-
Google 관리 콘솔에서 메뉴
보고
데이터 통합 (또는 교육 관리자의 경우 BigQuery 내보내기)로 이동하여 데이터 통합 페이지를 엽니다.
보고서 관리자 권한이 필요합니다.
- 새 데이터 세트 이름을 입력합니다.
- 기존 데이터를 새 위치로 백필하려면 지난 180일 동안의 기존 BigQuery 데이터를 새 데이터 세트로 백필 체크박스를 선택합니다.
- 확인
저장을 클릭합니다.
로그 데이터 내보내기 요구사항
로그 데이터는 insertAll API를 통해 내보내게 되며 BigQuery Export 프로젝트에 결제를 사용 설정해야 합니다. 결제를 사용 설정하지 않으면 프로젝트가 샌드박스 모드가 되고 로그 데이터가 데이터 세트로 내보내지지 않습니다. 자세한 내용은 제한사항을 참고하세요.
참고: 사용 보고서 내보내기는 샌드박스 모드 프로젝트에서 계속 사용할 수 있습니다.
지연 시간
대부분의 경우 BigQuery로 데이터 내보내기를 사용 설정한 후 10분 이내에 활동 로그 이벤트를 사용할 수 있습니다. 초기 구성에서는 사용 로그 이벤트가 48시간 지연되지만 그 이후에는 일반적으로 1~3일이 지연됩니다. 자세한 내용은 데이터 보관 및 지연 시간을 참고하세요.
FAQ
내보내기에 데이터 만료 시간을 설정하려면 어떻게 해야 하나요?
기본적으로 데이터 내보내기 만료 시간은 60일로 설정되어 있습니다. 따라서 수행하는 모든 BigQuery 데이터 내보내기는 60일 후에 Google Cloud에서 삭제됩니다.
만료 시간을 변경하려면 테이블 기본 만료 시간 업데이트로 이동하세요.
BigQuery 프로젝트 ID를 변경할 수 있나요?
예, 언제든지 BigQuery Export 구성의 프로젝트 ID를 변경할 수 있습니다. 변경사항은 다음 날 데이터가 새 BigQuery 프로젝트에 복사될 때부터 적용됩니다.
중요: 이전 데이터는 새 테이블에 복사되지 않으므로 BigQuery 프로젝트를 변경해서는 안 됩니다. 이전 데이터에 액세스하려면 이전 프로젝트에 액세스하세요.
BigQuery Export는 어떤 서비스를 지원하나요?
지원되는 로그 이벤트 데이터는 다음과 같습니다.
- 계정
- 관리자
- Google Calendar
- Chrome
- 클래스룸
- 데이터 이전
- 기기
- Google Drive
- Workspace를 위한 Gemini
- Gmail
- Google Chat
- Google Meet
- Google Meet 하드웨어
- Google 그룹스
- 로그인
- Looker Studio
- 규칙
- SAML
- OAuth
지원되는 사용 보고서는 다음과 같습니다.
- 계정
- Google Apps Script
- Google AppSheet
- 캘린더
- ChromeOS
- 클래스룸
- 기기
- Google Docs
- 드라이브
- Gmail
- Google 검색
- Meet
- Google Sites
- Google Voice
참고: Google에서는 Google 검색을 비롯한 더 많은 로그 이벤트를 지원할 계획입니다.
로그 이벤트를 BigQuery로 내보내는 데 비용이 드나요?
예. 이는 Google에서 실시간으로 로그를 조회할 때 insertAll API를 사용하기 때문입니다. 자세한 내용은 데이터 수집 가격 책정을 참고하세요.
기기 또는 Meet 보고서와 같은 사용 보고서는 내보낼 때 비용이 발생하지 않습니다.