ส่งออกข้อมูลเมตาในไดรฟ์ขององค์กร

รุ่นที่รองรับฟีเจอร์นี้ ได้แก่ Frontline Plus; Enterprise Standard และ Enterprise Plus; Education Standard และ Education Plus; Enterprise Essentials Plus; Cloud Identity Premium เปรียบเทียบรุ่นของคุณ

ในฐานะผู้ดูแลระบบ คุณสามารถส่งออกข้อมูลเมตาใน Google ไดรฟ์ขององค์กรไปยัง BigQuery ได้ ซึ่งจะประกอบด้วยข้อมูลเมตาที่เชื่อมโยงกับแต่ละไฟล์ เช่น ขนาด ป้ายกำกับที่ใช้ และบุคคลที่คุณแชร์ด้วย แต่ไม่รวมเนื้อหาของไฟล์ คุณสามารถตรวจสอบข้อมูลนี้เพื่อประเมินว่าการเข้าถึงไฟล์ที่มีความละเอียดอ่อนเป็นไปตามกฎระเบียบ การปฏิบัติตามข้อกำหนด และเป้าหมายด้านความปลอดภัยข้อมูลขององค์กรหรือไม่

เมื่อข้อมูลเมตาในไดรฟ์อยู่ใน BigQuery คุณจะสร้างการรายงานและแดชบอร์ดที่กำหนดเองได้โดยใช้เครื่องมือวิเคราะห์ เช่น Looker Studio และพาร์ทเนอร์การแสดงข้อมูลผ่านภาพของบุคคลที่สาม

หมายเหตุ

  • ขั้นตอนบางอย่างในหน้านี้จะดำเนินการในคอนโซล Google Cloud เนื่องจาก Google BigQuery เป็นผลิตภัณฑ์ของ Google Cloud
  • คุณต้องตั้งค่าการเรียกเก็บเงินสำหรับโปรเจ็กต์ Google Cloud เนื่องจากจะมีค่าใช้จ่ายในการค้นหาและจัดเก็บการส่งออกข้อมูลเมตาในไดรฟ์ใน BigQuery ดูรายละเอียดได้ที่ดูรายละเอียดราคาของ BigQuery ในบัญชีสำหรับการเรียกเก็บเงิน คุณสามารถประเมินค่าใช้จ่ายในการจัดเก็บข้อมูลได้ด้วยเครื่องคำนวณราคาของ Google Cloud โดยข้อมูลเมตาของไฟล์ 1 ล้านไฟล์จะใช้พื้นที่เก็บข้อมูลจริงประมาณ 1.5 GB ใน BigQuery
  • คุณต้องมีใบอนุญาตที่รองรับเพื่อตั้งค่าการส่งออกรายงานข้อมูลเมตาในไดรฟ์ แต่รายงานจะมีข้อมูลของผู้ใช้ทุกคน
  • ระบบจะส่งออกข้อมูลเมตาในไดรฟ์ทุกสัปดาห์ แต่คุณจะเลือกส่งออกทุกวันได้ โดยการส่งออกที่เกิดขึ้นจะเขียนทับการส่งออกก่อนหน้านี้ หากต้องการเก็บการส่งออกก่อนหน้าไว้ ให้ใช้บริการโอนข้อมูล BigQuery เพื่อคัดลอกชุดข้อมูลโดยอัตโนมัติ
  • อาจมีโอกาสเล็กน้อยที่การส่งออกข้อมูลเมตาในไดรฟ์จะไม่มีข้อมูลเมตาของบางไฟล์ และในบางกรณีที่เกิดขึ้นไม่บ่อยนัก ระบบอาจไม่รวมไฟล์บางรายการ

ขั้นตอนที่ 1 ตั้งค่าโปรเจ็กต์และชุดข้อมูล BigQuery สำหรับข้อมูลเมตาในไดรฟ์ของคุณ

  1. สร้างหรือเปิดโปรเจ็กต์ BigQuery ที่ใช้งานอยู่ในคอนโซล Google Cloud
    โปรดดูรายละเอียดที่หัวข้อการสร้างและจัดการโปรเจ็กต์
  2. เปิดใช้การเรียกเก็บเงินสำหรับโปรเจ็กต์หากยังไม่ได้เปิด
  3. ไปที่หน้า IAM ของโปรเจ็กต์
  4. ให้สิทธิ์บัญชีผู้ดูแลระบบ Google Workspace เข้าถึงการส่งออกเพื่อประมวลผลและดูข้อมูล ดูข้อมูลเพิ่มเติมเกี่ยวกับบทบาทและสิทธิ์ IAM สำหรับ BigQuery และวิธีควบคุมการเข้าถึงทรัพยากร สำหรับบัญชี Google Workspace ที่คุณต้องการให้สิทธิ์เข้าถึงการส่งออก ให้ทำดังนี้
    1. คลิกให้สิทธิ์เข้าถึงที่ด้านบนของรายชื่อผู้ใช้หลัก
    2. ในส่วนเพิ่มผู้ใช้หลัก ให้ป้อนอีเมลของบัญชี Google Workspace
    3. คลิกบทบาทผู้แก้ไขข้อมูล BigQuery (bigquery.dataEditor) เคล็ดลับ: คลิกตัวกรอง แล้วป้อน BigQuery เพื่อค้นหาบทบาทอื่นๆ ที่เฉพาะเจาะจงสำหรับ BigQuery
    4. คลิกบันทึก
  5. ให้สิทธิ์ผู้ดูแลระบบ IAM แก่ตัวคุณเองและผู้ดูแลระบบคนอื่นๆ ที่จะจัดการการส่งออกข้อมูลเมตาในไดรฟ์ในโปรเจ็กต์ โดยทำดังนี้
    1. ในหน้า IAM เดียวกัน ให้คลิกผู้ใช้หลักที่มีอยู่หรือสร้างผู้ใช้หลักใหม่ตามขั้นตอนก่อนหน้า
    2. คลิกบทบาทผู้จัดการทรัพยากร แล้วเลือกผู้ดูแลระบบ IAM ของโปรเจ็กต์
    3. คลิกบันทึก
  6. ค้นหาหรือสร้างชุดข้อมูล BigQuery เพื่อจัดเก็บการส่งออกข้อมูลเมตาในไดรฟ์
    1. คลิกเมนูการนำทาง จากนั้นBigQuery
    2. ในแผง Explorer ทางด้านซ้าย ให้ขยายโปรเจ็กต์เพื่อแสดงรายการชุดข้อมูลที่มีอยู่
    3. หากมีชุดข้อมูลที่ต้องการใช้ ให้จดรหัสไว้เพื่อใช้ในขั้นตอนถัดไป
    4. หากต้องการใช้ชุดข้อมูลใหม่ ให้ไปที่การสร้างชุดข้อมูล จดชื่อชุดข้อมูลไว้เพื่อใช้ในขั้นตอนถัดไป

ขั้นตอนที่ 2 เปิดและตั้งค่าการส่งออกข้อมูลเมตาในไดรฟ์

  1. ในคอนโซลผู้ดูแลระบบของ Google ให้ไปที่เมนู จากนั้น การรายงาน จากนั้นการผสานรวมข้อมูล (หรือ BigQuery Export สำหรับผู้ดูแลระบบด้านการศึกษา ซึ่งจะเปิดหน้าการผสานรวมข้อมูล)

    ต้องมีสิทธิ์ของผู้ดูแลระบบสำหรับรายงาน

  2. คลิกการส่งออกข้อมูลเมตาในไดรฟ์
  3. เลือกช่องเปิดใช้การส่งออกรายงานพื้นที่ในไดรฟ์ไปยัง Google BigQuery เพื่อเปิดใช้การส่งออกข้อมูลเมตาในไดรฟ์
  4. ในส่วนรหัสโปรเจ็กต์ BigQuery ให้เลือกโปรเจ็กต์ที่คุณต้องการเก็บการส่งออกคลังข้อมูลในไดรฟ์ หากไม่เห็นโปรเจ็กต์ ให้ตั้งโปรเจ็กต์ขึ้นมาใน BigQuery โปรดดูรายละเอียดที่คู่มือเริ่มใช้งานฉบับย่อสำหรับคอนโซล Google Cloud
  5. ในส่วนชุดข้อมูลที่มีอยู่ภายในโปรเจ็กต์ ให้ใส่ชื่อชุดข้อมูลที่จะใช้เก็บบันทึกข้อมูลเมตาในไดรฟ์ในโปรเจ็กต์ หากยังไม่มีชุดข้อมูล โปรดดูขั้นตอนที่หัวข้อการสร้างชุดข้อมูล
  6. ในส่วนกำหนดเวลาการส่งออก ให้เลือกรายสัปดาห์หรือรายวัน
  7. คลิกบันทึก หากได้รับข้อผิดพลาดว่าบันทึกไม่ได้ ให้ตรวจสอบปัญหาต่อไปนี้ในคอนโซล Google Cloud
    1. ไปที่หน้า IAM ของโปรเจ็กต์ และตรวจสอบว่าบัญชีของคุณมีบทบาทผู้ดูแลระบบ IAM ของโปรเจ็กต์ (resourcemanager.projects.setIamPolicy) หากไม่มี ให้มอบบทบาทดังกล่าวให้กับบัญชีของคุณ
    2. ไปที่เครื่องมือแก้ปัญหาเกี่ยวกับนโยบาย แล้วตรวจสอบว่ามีนโยบายการปฏิเสธที่บล็อกการเข้าถึงโปรเจ็กต์ของคุณหรือไม่ โปรดดูรายละเอียดที่หัวข้อแก้ปัญหานโยบาย

หลังจากเปิดใช้การส่งออกแล้ว การส่งออกแรกควรปรากฏใน BigQuery ใน 1-2 สัปดาห์ หลังจากนั้น ระบบจะอัปเดตการส่งออกทุกสัปดาห์หรือทุกวัน ขึ้นอยู่กับตัวเลือกที่คุณเลือกในการตั้งค่า

ขั้นตอนที่ 3 (ไม่บังคับ) อัปเดตเวลาหมดอายุของข้อมูล

เวลาหมดอายุเริ่มต้นของการส่งออกข้อมูลคือ 60 วัน ซึ่งระบบจะลบข้อมูลออกจาก Google Cloud หลังจากผ่านช่วงเวลาดังกล่าวแล้ว

หากต้องการเปลี่ยนเวลาหมดอายุ ให้ไปที่หัวข้อ Updating default table expiration times

ขั้นตอนที่ 4 ตรวจสอบการส่งออกและตั้งค่าการแจ้งเตือนสำหรับการทำงานผิดพลาด

เหตุการณ์การส่งออกข้อมูลเมตาในไดรฟ์จะรวมอยู่ในเหตุการณ์ในบันทึกของผู้ดูแลระบบ ในเครื่องมือตรวจสอบความปลอดภัย คุณสามารถค้นหาเหตุการณ์ที่เกี่ยวข้องกับการส่งออกข้อมูลเมตาในไดรฟ์และตั้งค่าการแจ้งเตือนได้

ชื่อเหตุการณ์ รายละเอียด
การส่งออกการรายงานข้อมูลเมตาในไดรฟ์เสร็จสมบูรณ์ บันทึกเมื่อการส่งออกเสร็จสมบูรณ์
การส่งออกการรายงานข้อมูลเมตาในไดรฟ์ไม่สำเร็จ บันทึกเมื่อการส่งออกล้มเหลว คุณสามารถกำหนดค่าการแจ้งเตือนเพื่อรับการแจ้งเตือนเมื่อการส่งออกไม่สำเร็จได้ หากต้องการแก้ไข ให้ไปที่แก้ปัญหาการส่งออกที่หายไปและข้อความแสดงข้อผิดพลาดในหน้านี้
สร้างการกำหนดค่าการส่งออกข้อมูลเมตาในไดรฟ์แล้ว บันทึกเมื่อผู้ดูแลระบบตั้งค่าการส่งออกข้อมูลเมตาในไดรฟ์
อัปเดตการกำหนดค่าการส่งออกข้อมูลเมตาในไดรฟ์แล้ว บันทึกเมื่อมีการอัปเดตโปรเจ็กต์หรือชุดข้อมูล
เริ่มลบการกำหนดค่าการส่งออกข้อมูลเมตาในไดรฟ์แล้ว บันทึกเมื่อผู้ดูแลระบบลบการกำหนดค่าการส่งออกข้อมูลเมตาในไดรฟ์ในคอนโซลผู้ดูแลระบบ ช่วงเวลาระหว่างที่ผู้ดูแลระบบเริ่มการลบและช่วงเวลาที่ระบบลบการกําหนดค่าจริงอาจมีความล่าช้า

ขั้นตอนที่ 5 วิเคราะห์ชุดข้อมูลเมตาในไดรฟ์

คุณวิเคราะห์ข้อมูลได้โดยตรงใน BigQuery โดยดูภาพรวมได้ที่ภาพรวมของข้อมูลวิเคราะห์ BigQuery | Google Cloud และดูรายละเอียดได้ที่หัวข้อสคีมาและการค้นหาตัวอย่างสำหรับการส่งออกข้อมูลเมตาในไดรฟ์ใน BigQuery

แก้ปัญหาการส่งออกที่หายไปและข้อความแสดงข้อผิดพลาด

หากไม่เห็นการส่งออกข้อมูลเมตาในไดรฟ์ใน BigQuery หลังจากที่บันทึกการกำหนดค่าในคอนโซลผู้ดูแลระบบ ให้ตรวจสอบปัญหาและวิธีแก้ไขต่อไปนี้

ข้อความแสดงข้อผิดพลาด วิธีแก้ไข
ไม่มีชุดข้อมูล BigQuery หากมีการลบชุดข้อมูลที่คุณระบุไว้ให้เขียนรายงานตั้งแต่เวลาที่เปิดใช้การส่งออกข้อมูลเมตาในไดรฟ์ คุณจะได้รับข้อผิดพลาดนี้ ให้แทนที่รหัสชุดข้อมูลด้วยรหัสของชุดข้อมูลที่มีอยู่
ไม่มีโปรเจ็กต์ BigQuery หากโปรเจ็กต์ BigQuery ที่คุณระบุไว้ตั้งแต่แรกให้เขียนรายงานถูกลบไปตั้งแต่ที่คุณเปิดใช้การส่งออกข้อมูลเมตาในไดรฟ์ คุณจะได้รับข้อผิดพลาดนี้ ตั้งค่าโปรเจ็กต์และชุดข้อมูล BigQuery ใหม่เพื่อให้ระบบเขียนรายงานลงในโปรเจ็กต์และชุดข้อมูลดังกล่าว
มีการนำสิทธิ์ของบัญชีบริการการส่งออกข้อมูลเมตาในไดรฟ์ในชุดข้อมูล BigQuery ออก ในคอนโซล Google Cloud ให้ยืนยันว่าบัญชีบริการมีสิทธิ์เข้าถึงระดับผู้แก้ไขในชุดข้อมูล
มีการนำสิทธิ์ของบัญชีบริการการส่งออกข้อมูลเมตาในไดรฟ์ในโปรเจ็กต์ BigQuery ออก ในคอนโซล Google Cloud ให้ตรวจสอบว่าบัญชีบริการมีสิทธิ์เข้าถึง BigQuery.jobUser ในโปรเจ็กต์
ตั้งค่าการเรียกเก็บเงินสำหรับโปรเจ็กต์

หากคุณดาวน์เกรดการสมัครใช้บริการ ก็อาจทำให้ไม่รองรับการส่งออกข้อมูลเมตาในไดรฟ์อีก ในคอนโซลผู้ดูแลระบบ ให้ไปที่เมนู > การเรียกเก็บเงิน > การสมัครใช้บริการ และยืนยันว่าการสมัครใช้บริการของคุณเป็นไปอย่างใดอย่างหนึ่ง ดังนี้

รุ่นที่รองรับฟีเจอร์นี้ ได้แก่ Frontline Plus; Enterprise Standard และ Enterprise Plus; Education Standard และ Education Plus; Enterprise Essentials Plus; Cloud Identity Premium เปรียบเทียบรุ่นของคุณ

หลังจากเปลี่ยนไปใช้รุ่นที่รองรับการส่งออกข้อมูลเมตาในไดรฟ์แล้ว การส่งออกรายงานอาจใช้เวลาถึง 2 สัปดาห์

นอกจากนี้ คุณยังต้องตั้งค่าการเรียกเก็บเงินสำหรับโปรเจ็กต์ Google Cloud ที่ลิงก์กับการส่งออกข้อมูลเมตาในไดรฟ์ด้วย เนื่องจากการส่งออกข้อมูลเมตาในไดรฟ์ไปยัง BigQuery มีค่าใช้จ่าย ตรวจสอบว่าได้เปิดใช้การเรียกเก็บเงินสำหรับโปรเจ็กต์แล้ว

ข้อจำกัดที่ทราบ

  • การส่งออกข้อมูลเมตาในไดรฟ์อาจไม่รวมไฟล์หรือวิดีโอ Jamboard ที่ถอนการอ้างสิทธิ์แล้วซึ่งสร้างด้วย Google Vids

คำถามที่พบบ่อย

การส่งออกข้อมูลเมตาในไดรฟ์ไปยัง BigQuery มีค่าใช้จ่ายไหม

ได้ ระบบจะเรียกเก็บค่าใช้จ่ายในการจัดเก็บข้อมูลจากโปรเจ็กต์ BigQuery ดูรายละเอียดได้ที่ดูรายละเอียดราคาของ BigQuery ในบัญชีสำหรับการเรียกเก็บเงิน คุณสามารถประเมินค่าใช้จ่ายในการจัดเก็บข้อมูลได้ด้วยเครื่องคำนวณราคาของ Google Cloud โดยข้อมูลเมตาของไฟล์ 1 ล้านไฟล์จะใช้พื้นที่เก็บข้อมูลจริงประมาณ 1.5 GB ใน BigQuery

การส่งออกข้อมูลเมตาในไดรฟ์อยู่ภายใต้ข้อกำหนดในการให้บริการของ Google Workspace ไหม

ไม่ การส่งออกข้อมูลเมตาในไดรฟ์จะอยู่ภายใต้ข้อกำหนดในการให้บริการของ Google Cloud Platform หรือข้อตกลงที่ควบคุมการใช้งาน Google Cloud Platform ของคุณ

มีข้อมูลใดอยู่ในการส่งออกข้อมูลเมตาในไดรฟ์บ้าง

โปรดดูรายละเอียดที่สคีมา

ฉันจะเปลี่ยนรหัสโปรเจ็กต์หรือชุดข้อมูล BigQuery ได้ไหม

คุณทำได้ ทั้งนี้โปรดทราบว่าการส่งออกใหม่และการส่งออกครั้งล่าสุดก่อนที่การเปลี่ยนแปลงจะอยู่ในตำแหน่งที่แตกต่างกัน

ฉันจะส่งออกไปยังโปรเจ็กต์ BigQuery เดียวกับที่ใช้สำหรับการส่งออกบันทึกบริการไปยัง BigQuery ได้ไหม

ได้ หากตั้งค่าการส่งออกบันทึกบริการไปยัง BigQuery ด้วย คุณจะใช้รหัสโปรเจ็กต์และชุดข้อมูลเดียวกันได้ ข้อมูลเมตาในไดรฟ์ของคุณจะไปอยู่ในตารางอื่นในโปรเจ็กต์

ฉันจะหยุดส่งออกข้อมูลเมตาในไดรฟ์ไปยัง BigQuery ได้ไหม

ได้ หากไม่ต้องการส่งออกข้อมูลเมตาในไดรฟ์ไปยัง BigQuery อีกต่อไป คุณสามารถลบการกำหนดค่าข้อมูลเมตาในไดรฟ์ในคอนโซลผู้ดูแลระบบได้

  1. ในคอนโซลผู้ดูแลระบบของ Google ให้ไปที่เมนู จากนั้น การรายงาน จากนั้นการผสานรวมข้อมูล (หรือ BigQuery Export สำหรับผู้ดูแลระบบด้านการศึกษา ซึ่งจะเปิดหน้าการผสานรวมข้อมูล)

    ต้องมีสิทธิ์ของผู้ดูแลระบบสำหรับรายงาน

  2. คลิกข้อมูลเมตาในไดรฟ์
  3. คลิกรหัสโปรเจ็กต์ BigQuery แล้วเลือกโปรเจ็กต์
  4. คลิกลบ
  5. คลิกลบอีกครั้งเพื่อยืนยัน

ระบบจะไม่ส่งออกข้อมูลเมตาในไดรฟ์ของคุณอีกต่อไป ชุดข้อมูลจะยังคงอยู่ในโปรเจ็กต์พร้อมกับข้อมูลที่มีอยู่ แต่ระบบจะลบข้อมูลเมื่อหมดอายุ

หากต้องการเริ่มต้นการส่งออกข้อมูลเมตาในไดรฟ์อีกครั้ง ให้เพิ่มรหัสโปรเจ็กต์

เหตุใดจึงมีการเพิ่มบัญชีบริการลงในโปรเจ็กต์และชุดข้อมูล BigQuery ของฉัน

คุณอาจเห็นบัญชีบริการชื่อ id@gcp-sa-statefulreporting.iam.gserviceaccount.com และบัญชีบริการอีกบัญชีหนึ่งชื่อ drive-inventory-reporting@system.gserviceaccount.com ในรายการสิทธิ์สำหรับโปรเจ็กต์และชุดข้อมูล BigQuery ในช่วงเบต้า ระบบจะใช้บัญชีบริการหนึ่งเพื่ออ่านข้อมูลเมตาจากไดรฟ์ และจะใช้อีกบัญชีเพื่อเขียนข้อมูลเมตาในไดรฟ์ไปยัง BigQuery

เหตุใดฉันจึงได้รับข้อผิดพลาดเกี่ยวกับบัญชีบริการเมื่อพยายามตั้งค่าการส่งออกข้อมูลเมตาในไดรฟ์

หากนโยบายองค์กรป้องกันไม่ให้บัญชีบริการ id@gcp-sa-statefulreporting.iam.gserviceaccount.com และ drive-inventory-reporting@system.gserviceaccount.com เข้าร่วมรายการสิทธิ์ โดเมนของบัญชีจะต้องเพิ่มในรายการที่อนุญาต

เหตุใดฉันจึงได้รับข้อผิดพลาดเกี่ยวกับสิทธิ์เมื่อพยายามตั้งค่าการส่งออกข้อมูลเมตาในไดรฟ์

คุณต้องมีสิทธิ์ดูและสิทธิ์ผู้ดูแลระบบสำหรับนโยบายอนุญาตในโปรเจ็กต์จึงจะตั้งค่าการส่งออกข้อมูลเมตาในไดรฟ์ได้ ในคอนโซล Google Cloud ให้ไปที่หน้า IAM แล้วมอบหมายบทบาทผู้ดูแลระบบ IAM ของโปรเจ็กต์ (roles/resourcemanager.projectIamAdmin) ให้กับบัญชีผู้ดูแลระบบ Google Workspace

การส่งออกข้อมูลเมตาในไดรฟ์รองรับเขตข้อมูลไหม

ได้ หากคุณตั้งค่านโยบายเขตข้อมูลในคอนโซลผู้ดูแลระบบ ระบบจะประมวลผลข้อมูลในเขตนั้น อย่างไรก็ตาม ระบบจะเขียนการส่งออก BigQuery ไปยังเขตข้อมูลที่คุณระบุเมื่อสร้างชุดข้อมูล โปรดดูรายละเอียดที่หัวข้อตำแหน่ง BigQuery