गतिविधि के लॉग इवेंट (किसी उपयोगकर्ता की ओर से की गई एक कार्रवाई) और इस्तेमाल की रिपोर्ट (किसी ऐप्लिकेशन के लिए एग्रीगेट की गई रिपोर्ट) को Google BigQuery में एक्सपोर्ट करने के लिए, आपको Google Admin console में BigQuery Export कॉन्फ़िगरेशन सेट अप करना होगा.
BigQuery और Reports API के डेटा के बारे में जानकारी
BigQuery डेटासेट में उपलब्ध डेटा, Reports API से वापस पाए गए डेटा से अलग होता है. BigQuery डेटा में सिर्फ़ बिना फ़िल्टर किया गया डेटासेट शामिल होता है. एसक्यूएल का इस्तेमाल करके अब भी डेटा को फ़िल्टर किया जा सकता है. हालांकि, Reports API के सभी पैरामीटर काम नहीं करते.
एपीआई अनुरोध में पैरामीटर शामिल करके, Reports API के डेटा को फ़िल्टर किया जा सकता है.
उदाहरण: किसी डोमेन में संगठन की दो इकाइयां हैं, A और B. Reports API और BigQuery का इस्तेमाल करके, पूरे डोमेन (A और B ) के सभी इवेंट ऐक्सेस किए जा सकते हैं.
- हालांकि, Reports API की मदद से, एपीआई अनुरोध में orgUnitID पैरामीटर का इस्तेमाल करके, A इवेंट वापस पाए जा सकते हैं.
- एसक्यूएल और BigQuery की मदद से, इवेंट को संगठन की इकाई के हिसाब से फ़िल्टर नहीं किया जा सकता. ऐसा इसलिए, क्योंकि orgUnitID पैरामीटर से मेल खाने वाला कोई कॉलम नहीं है.
अहम जानकारी:
- BigQuery डेटा में पुराना डेटा शामिल होता है. गतिविधि के डेटा के लिए 180 दिन और इस्तेमाल के डेटा के लिए 450 दिन. Reports API से भी पुराना डेटा वापस पाया जा सकता है.
- Google Workspace के डेटा को BigQuery में एक्सपोर्ट करने की सुविधा बंद करने पर, BigQuery Export में कोई नया डेटा शामिल नहीं किया जाता. हालांकि, मौजूदा डेटा अन्य सोर्स में उपलब्ध है. जैसे, Reports API.
- BigQuery टेबल में, छद्म कॉलम (_PARTITIONTIME) के आधार पर दिन के हिसाब से सेगमेंट बनाए जाते हैं. ये पार्टिशन, गतिविधि टेबल के लिए time_usec कॉलम और इस्तेमाल से जुड़ी टेबल के लिए तारीख कॉलम से लिए जाते हैं. खास तौर पर, Workspace, BigQuery के यूटीसी टाइमज़ोन की डिफ़ॉल्ट सीमाओं को बदल देता है, ताकि पार्टीशन को पैसिफ़िक टाइम (पीटी) के साथ अलाइन किया जा सके. BigQuery क्वेरी की लागत को ऑप्टिमाइज़ करने के लिए, Google का सुझाव है कि आप _PARTITIONTIME के साथ-साथ time_usec या तारीख के हिसाब से फ़िल्टर करें.
- सेवा की रिपोर्ट का पूरा डेटा, BigQuery Export में उपलब्ध नहीं होता. जिन सेवाओं के लिए BigQuery Export की सुविधा उपलब्ध है उनकी सूची देखने के लिए, इस पेज पर BigQuery Export की सुविधा किन सेवाओं के लिए उपलब्ध है? पर जाएं.
- क्वेरी के उदाहरण देखने के लिए, BigQuery में रिपोर्टिंग लॉग की क्वेरी के उदाहरण पर जाएं.
डेटा को कैसे ट्रांसफ़र किया जाता है और उसे कितने समय तक सेव रखा जाता है
- नीतियों को लागू होने में एक घंटा लग सकता है. इसके बाद, आपके डेटासेट में हर दिन टेबल बनाई जाती हैं (पैसिफ़िक समय के हिसाब से).
- डेटा को अन्य लॉग और रिपोर्ट के दिशा-निर्देशों के मुताबिक सेव किया जाता है. ज़्यादा जानकारी के लिए, डेटा का रखरखाव और डेटा अपडेट होने में लगने वाला समय लेख पढ़ें.
- डेटा टेबल अपने-आप नहीं मिटती हैं. चालू प्रोजेक्ट को मिटाने के लिए, BigQuery Export कॉन्फ़िगरेशन मिटाना पर जाएं.
- गतिविधि के लॉग इवेंट, 10 मिनट के अंदर उपलब्ध हो जाते हैं. इस्तेमाल के लॉग इवेंट को पहली बार कॉन्फ़िगर करने पर, डेटा दिखने में 48 घंटे लगते हैं. हालांकि, इसके बाद डेटा दिखने में सामान्य तौर पर 1 से 3 दिन लगते हैं.
शुरू करने से पहले
अहम जानकारी: अगर Google Cloud में डोमेन के हिसाब से शेयर करने की सुविधा पर पाबंदी लगाने वाली संगठन की नीति का इस्तेमाल किया जाता है, तो पक्का करें कि आपने Google ग्राहक आईडी C02h8e9nw को अनुमति वाली सूची में जोड़ा हो.
इसके लिए, आपको सबसे पहले Google Cloud Console में BigQuery प्रोजेक्ट सेट अप करना होगा. प्रोजेक्ट बनाते समय, यह तरीका अपनाएं:
- Google Workspace एडमिन खाते को इस तरह जोड़ें:
- BigQuery एडमिन (roles/bigquery.admin) या पहचान और ऐक्सेस मैनेजमेंट (आईएएम) की इससे मिलती-जुलती भूमिका
- प्रोजेक्ट का आईएएम एडमिन (roles/resourcemanager.projectIamAdmin)
- gapps-reports@system.gserviceaccount.com सेवा खाते को प्रोजेक्ट एडिटर (या IAM एडिटर की भूमिका के बराबर) के तौर पर जोड़ें. आपको इसकी ज़रूरत लॉग लिखने, स्कीमा अपडेट करने, और बाद में पांचवां चरण पूरा करने के लिए होती है.
निर्देशों के लिए, रिपोर्टिंग लॉग के लिए BigQuery प्रोजेक्ट सेट अप करना पर जाएं.
पहला चरण: BigQuery Export कॉन्फ़िगरेशन सेट अप करना
-
Google Admin console में, मेन्यू
रिपोर्टिंग
डेटा इंटिग्रेशन पर जाएं. इसके अलावा, Education एडमिन के लिए Big Query एक्सपोर्ट पर जाएं. इससे डेटा इंटिग्रेशन पेज खुलता है.
इसके लिए, आपके पास रिपोर्ट से जुड़ा एडमिन का अधिकार होना ज़रूरी है.
- BigQuery Export कार्ड पर कर्सर ले जाएं और बदलाव करें
पर क्लिक करें.
- BigQuery के लॉग चालू करने के लिए, Google Workspace के डेटा को Google BigQuery में एक्सपोर्ट करने की सुविधा चालू करें बॉक्स पर सही का निशान लगाएं.
- (ज़रूरी नहीं) डीएलपी के नियमों के संवेदनशील पैरामीटर एक्सपोर्ट करने के लिए, डीएलपी के नियमों के लॉग से संवेदनशील कॉन्टेंट एक्सपोर्ट करने की अनुमति दें बॉक्स को चुनें. ज़्यादा जानकारी के लिए, डीएलपी के नियमों का उल्लंघन करने वाला कॉन्टेंट देखना पर जाएं.
- BigQuery प्रोजेक्ट आईडी में जाकर, वह प्रोजेक्ट चुनें जिसमें आपको लॉग सेव करने हैं. वह प्रोजेक्ट चुनें जिसके लिए gapps-reports@system.gserviceaccount.com के पास एडिटर की भूमिका हो या आईएएम एडिटर की भूमिका हो. अगर आपको प्रोजेक्ट नहीं दिख रहा है, तो इसे BigQuery में सेट अप करना होगा. ज़्यादा जानकारी के लिए, Google Cloud Console का इस्तेमाल करके क्विकस्टार्ट करना पर जाएं.
- प्रोजेक्ट में नया डेटासेट में जाकर, उस डेटासेट का नाम डालें जिसका इस्तेमाल प्रोजेक्ट में लॉग सेव करने के लिए किया जाएगा. डेटासेट के नाम हर प्रोजेक्ट के लिए अलग होने चाहिए. ज़्यादा जानकारी के लिए, डेटासेट बनाना लेख पढ़ें.
- (ज़रूरी नहीं) किसी खास जगह के लिए डेटासेट पर पाबंदी लगाएं बॉक्स पर सही का निशान लगाएं
मेन्यू से जगह चुनें. ज़्यादा जानकारी के लिए, एक से ज़्यादा क्षेत्र पर जाएं.
- सेव करें पर क्लिक करें. ध्यान दें: अगर प्रोजेक्ट सेव नहीं हो रहा है, तो Google Cloud Console पर जाएं. इसके बाद, नया डेटासेट मिटाएं और फिर Admin console में जाकर उसे फिर से सेव करें.
एक्सपोर्ट करने की सुविधा चालू होने पर, डेटासेट अगले दिन बनाया जाता है. प्रोजेक्ट के मालिकों, संपादकों, और दर्शकों के साथ-साथ, gapps-reports@system.gserviceaccount.com सेवा खाते को संपादक के तौर पर जोड़ा जाता है. लॉग लिखने और स्कीमा को अपडेट करने के लिए, सेवा खाते की ज़रूरत होती है.
दूसरा चरण: BigQuery Export डेटासेट बदलना और नए डेटासेट में बैकफ़िल करना (ज़रूरी नहीं)
BigQuery Export की सेटिंग बदलकर, डेटा को मौजूदा डेटासेट के बजाय किसी दूसरे डेटासेट में एक्सपोर्ट किया जा सकता है. आपके पास मौजूदा डेटा को पिछले डेटासेट से नए डेटासेट में ट्रांसफ़र करने का विकल्प भी होता है. ऑडिट के लिए 180 दिनों का डेटा और इस्तेमाल के लिए 450 दिनों का डेटा ट्रांसफ़र किया जा सकता है. उदाहरण के लिए, BigQuery Export डेटासेट की जगह को अमेरिका से बदलकर ईयू किया जा सकता है. बैकफ़िल की सुविधा की मदद से, अमेरिका में पहले से सेव किए गए डेटा को यूरोपियन यूनियन में ट्रांसफ़र किया जा सकता है. बैकफ़िल का विकल्प चुनने पर, BigQuery बताई गई जगह पर एक नया डेटासेट बनाता है.
ज़रूरी बातें
- अगर नई जगह चुनी जाती है, प्रोजेक्ट आईडी बदला जाता है या डेटासेट आईडी बदला जाता है, तो मौजूदा डेटा को नए डेटासेट में एक्सपोर्ट कर दिया जाता है.
- एक्सपोर्ट किया गया डेटा, पिछले डेटासेट में भी सेव रहता है.
- नया डेटा और बैकफ़िल किया गया डेटा, नए डेटासेट में सेव किया जाता है.
- मौजूदा डेटा (ऑडिट के लिए 180 दिन और इस्तेमाल के लिए 450 दिन) को नए डेटासेट में एक्सपोर्ट किया जाता है. हालांकि, इसे मौजूदा जगह से नहीं मिटाया जाता. इसलिए, आपके पास BigQuery Export के डेटासेट दो जगहों पर होंगे.
नई जगह की जानकारी के लिए मौजूदा डेटा को बैकफ़िल करने के लिए:
-
Google Admin console में, मेन्यू
रिपोर्टिंग
डेटा इंटिग्रेशन पर जाएं. इसके अलावा, Education एडमिन के लिए Big Query एक्सपोर्ट पर जाएं. इससे डेटा इंटिग्रेशन पेज खुलता है.
इसके लिए, आपके पास रिपोर्ट से जुड़ा एडमिन का अधिकार होना ज़रूरी है.
- डेटासेट का नया नाम डालें.
- अगर आपको मौजूदा डेटा को नई जगह पर बैकफ़िल करना है, तो पिछले 180 दिनों के मौजूदा BigQuery डेटा को नए डेटासेट में बैकफ़िल करें बॉक्स पर सही का निशान लगाएं.
- पुष्टि करें
सेव करें पर क्लिक करें.
लॉग डेटा एक्सपोर्ट करने से जुड़ी ज़रूरी शर्तें
लॉग डेटा को insertAll API के ज़रिए एक्सपोर्ट किया जाता है. इसके लिए, आपको BigQuery Export प्रोजेक्ट के लिए बिलिंग चालू करनी होगी. अगर बिलिंग की सुविधा चालू नहीं है, तो आपका प्रोजेक्ट सैंडबॉक्स मोड में होगा. साथ ही, लॉग डेटा आपके डेटासेट में एक्सपोर्ट नहीं किया जाएगा. ज़्यादा जानकारी के लिए, सीमाएं लेख पढ़ें.
ध्यान दें: सैंडबॉक्स मोड वाले प्रोजेक्ट के लिए, इस्तेमाल की रिपोर्ट एक्सपोर्ट करने की सुविधा अब भी चालू है.
लैग टाइम
ज़्यादातर मामलों में, BigQuery में डेटा एक्सपोर्ट करने की सुविधा चालू करने के 10 मिनट के अंदर, गतिविधि के लॉग इवेंट उपलब्ध हो जाते हैं. इस्तेमाल के लॉग इवेंट को पहली बार कॉन्फ़िगर करने पर, डेटा दिखने में 48 घंटे लगते हैं. हालांकि, इसके बाद डेटा दिखने में सामान्य तौर पर 1 से 3 दिन लगते हैं. ज़्यादा जानकारी के लिए, डेटा का रखरखाव और डेटा अपडेट होने में लगने वाला समय लेख पढ़ें.
अक्सर पूछे जाने वाले सवाल
मैं एक्सपोर्ट किए गए डेटा के लिए, डेटा के ऐक्सेस की समयसीमा कैसे सेट करूं?
डिफ़ॉल्ट रूप से, डेटा एक्सपोर्ट करने की सुविधा के लिए 60 दिनों की समयसीमा सेट होती है. इसलिए, BigQuery से एक्सपोर्ट किया गया कोई भी डेटा, 60 दिनों के बाद Google Cloud से मिटा दिया जाता है.
ऐक्सेस खत्म होने का समय बदलने के लिए, डिफ़ॉल्ट टेबल के ऐक्सेस खत्म होने का समय अपडेट करना पर जाएं.
क्या BigQuery प्रोजेक्ट का आईडी बदला जा सकता है?
हां, BigQuery Export कॉन्फ़िगरेशन के लिए प्रोजेक्ट आईडी को किसी भी समय बदला जा सकता है. डेटा को नए BigQuery प्रोजेक्ट में कॉपी करने के बाद, अगले दिन से बदलाव लागू हो जाते हैं.
अहम जानकारी: आपको BigQuery प्रोजेक्ट नहीं बदलना चाहिए, क्योंकि पुराना डेटा नई टेबल में कॉपी नहीं किया जाता. पिछले डेटा को ऐक्सेस करने के लिए, पिछले प्रोजेक्ट को ऐक्सेस करें.
BigQuery Export की सुविधा किन सेवाओं के साथ काम करती है?
लॉग इवेंट का यह डेटा इस्तेमाल किया जा सकता है:
- खाते
- एडमिन
- Google Calendar
- Chrome
- Classroom
- डेटा माइग्रेशन
- डिवाइस
- Google Drive
- Gemini for Workspace
- Gmail
- Google Chat
- Google Meet
- Google Meet हार्डवेयर
- Google Groups
- लॉगिन करें
- Looker Studio
- नियम
- एसएएमएल
- OAuth
इस्तेमाल की ये रिपोर्ट उपलब्ध हैं:
- खाते
- Google Apps Script
- Google AppSheet
- Calendar
- ChromeOS
- Classroom
- डिवाइस
- Google Docs
- Drive
- Gmail
- Google Search
- Meet
- Google Sites
- Google Voice
ध्यान दें: हम Search जैसे ज़्यादा लॉग इवेंट के लिए, यह सुविधा उपलब्ध कराने का प्लान बना रहे हैं.
क्या लॉग इवेंट को BiqQuery में एक्सपोर्ट करने के लिए कोई शुल्क लिया जाता है?
हां. ऐसा इसलिए होता है, क्योंकि Google रीयल टाइम में लॉग देखने के लिए, insertAll API का इस्तेमाल करता है. ज़्यादा जानकारी के लिए, डेटा इंटेक की कीमत लेख पढ़ें.
डिवाइस या Meet की रिपोर्ट जैसी इस्तेमाल की रिपोर्ट एक्सपोर्ट करने के लिए कोई शुल्क नहीं लिया जाता.