הוספה אוטומטית של תוויות לקבצים ב-Google Drive באמצעות סיווג בעזרת AI

התכונה הזו כלולה במהדורות Frontline Plus ו-Enterprise Plus. היא כלולה גם בתוספים Gemini Enterprise–Legacy,‏ Gemini Education Premium ו-AI Security. השוואה בין תוספים

סיווג AI יכול להוסיף תוויות באופן אוטומטי לתוכן רגיש בארגון שלכם ב-Google Drive באמצעות מודלים של AI בהתאמה אישית שהארגון מאמן, בלי צורך בתכנות. אדמינים קובעים על אילו נתונים המודלים מתאמנים, כך שכל מודל הוא ייחודי לארגון שלכם ורק הארגון שלכם יכול להשתמש בו. אתם יכולים ליצור עד 5 מודלים ייחודיים של סיווג קבצים בעזרת AI לארגון שלכם.

אתם יכולים להשתמש בקבצים שסווגו על ידי AI במדיניות אבטחה כמו כללי הגנה על נתונים, Vault ועוד.

הערה: כדי שסיווג ה-AI יוסיף תוויות לקבצים, הם צריכים להיות בתיקיות אחסון שיתופי או בבעלות של משתמשים עם רישיונות שתומכים בתוויות סיווג.

סקירה כללית של סיווג קבצים בעזרת AI

אלה השלבים הבסיסיים להגדרת סיווג באמצעות AI כדי להוסיף תוויות באופן אוטומטי לקבצים חדשים וקיימים ב-Drive.

1. יוצרים מודל: קודם בוחרים או יוצרים תווית סיווג, שמודל ה-AI יחיל באופן אוטומטי על קבצים אחרי האימון שלו. אתם גם יוצרים את תווית האימון, שמשמשת לאימון המודל לזיהוי התוכן הרגיש של הארגון. אחר כך יוצרים מודל AI כדי להשתמש בתוויות האלה.

2. אימון המודל: אחרי שיוצרים את התוויות, המתייגים הייעודיים מסווגים קבצים ב-Drive באמצעות תווית האימון כדי ליצור את מערך נתוני האימון. לאחר מכן המודל משתמש במערך הנתונים כדי ללמוד איך לסווג קבצים רגישים.

3. הפעלת סיווג באמצעות AI: אחרי שהמודל מאומן, אפשר להגדיר תיוג אוטומטי של קבצים, שנקרא החלה אוטומטית. במהלך ההגדרה, בוחרים אילו אפשרויות של תוויות להפעיל ואילו משתמשים הם הבעלים של הקבצים שרוצים שסיווג ה-AI יחיל עליהם תוויות. לאחר מכן המודל מתחיל לתייג באופן אוטומטי קבצים רגישים.

4. מעקב אחרי המודל: אפשר להשתמש ביומן האירועים של Drive כדי לעקוב אחרי מספר הקבצים שסווגו, וגם אחרי מספר המשתמשים שאישרו או שינו תווית שהוחלה באופן אוטומטי (אם יש להם הרשאות).

לפני שמתחילים

יצירת מודל

כדי ליצור מודל, קודם צריך לבחור תווית סיווג קיימת או ליצור תווית חדשה. בשלב הבא, צריך ליצור תווית תואמת לאימון – באופן אוטומטי (מומלץ) או באופן ידני באמצעות המרכז לניהול תוויות – שמתייגת המסמכים המיועדת ישתמש בה.

בחירה או יצירה של תווית סיווג

צריך להפעיל את הסיווג ב-Drive וב-Docs. אחרי האימון, מודל ה-AI מחיל באופן אוטומטי את תווית הסיווג על קבצים רגישים ב-Drive. המודל מאומן על שדה אחד בלבד לכל תווית, שחייב להיות רשימת תגים או רשימת אפשרויות.

מומלץ להשתמש בתווית רגישות עם תיוג, כי היא מוצגת בצורה בולטת במסמכים:

כשמשתמשים בשדה של רשימת אפשרויות או רשימת תגים לתווית סיווג, השדה צריך:

  • להכיל לפחות 2 אפשרויות ועד 7 אפשרויות
  • לפרסם

אם יש לכם תווית קיימת שעומדת בדרישות האלה, אתם יכולים להשתמש בה כתווית סיווג. אחרת, אפשר להשתמש במנהל התוויות כדי ליצור תווית, לפני או במהלך הגדרת המודל (בהמשך הדף). פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.

יצירת תווית אימון

תווית האימון כמעט זהה לתווית הסיווג, והיא משמשת רק למטרות אימון על ידי מתייגים ייעודיים. כשיוצרים את המודל (בהמשך הדף הזה), אפשר ליצור אוטומטית את תווית האימון כדי לוודא שהיא תואמת לתווית הסיווג.

אפשר גם ליצור תווית אימון משלכם באופן ידני באמצעות המרכז לניהול תוויות, לפני הגדרת המודל או במהלך ההגדרה. פרטים נוספים מופיעים בהמשך הדף בקטע איך יוצרים ידנית תוויות לאימון?

יצירת המודל

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה and then שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על יצירת מודל.
  3. ברשימה תווית סיווג, בוחרים תווית סיווג ושדה קיימים לאימון המודל, או לוחצים על יצירת תווית כדי ליצור תווית באמצעות מנהל התוויות.

    אם יצרתם תווית במנהל התוויות, חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את התווית החדשה ברשימה.

  4. כדי לבחור את תווית הסיווג, בוחרים את השדה המתאים שרוצים להשתמש בו ברשימה שם השדה.
  5. לוחצים על המשך.
  6. (אופציונלי) אפשר ליצור ולפרסם באופן אוטומטי תווית אימון שתואמת לתווית הסיווג:
    1. לוחצים על יצירת תווית אימון.
    2. בהודעה שמופיעה, לוחצים על עדכון הרשאות התווית. התווית נפתחת במצב עריכה במנהל התוויות בכרטיסייה נפרדת.
    3. לוחצים על הרשאות ואז עריכה, ואז מעניקים את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים להגדרות לקבוצת משתמשים שמכילה את המשתמשים שמתייגים את הקבצים.
    4. לוחצים על שמירה וסוגרים את הכרטיסייה של מרכז ניהול התוויות.

      הערה: אפשר גם להגדיר הרשאות לתוויות מאוחר יותר. אבל חשוב שרק למתייגים תהיה גישה לתווית האימון.

  7. (אופציונלי) אם כבר יצרתם תווית אימון, בוחרים אותה ברשימה תווית אימון.
  8. (אופציונלי) כדי ליצור תווית אימון משלכם, לוחצים על מעבר למנהל התוויות.

    חשוב: מוודאים שהתווית עומדת בקריטריונים של תוויות אימון, ומגדירים את הרשאות הגישה לתווית כך שרק המתייגים יוכלו לגשת אליה. פרטים נוספים מופיעים בקטע הנחיות לגבי תוויות הדרכה בהמשך הדף.

    חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את תווית האימון החדשה ברשימה.

  9. בדף יצירת מודל, לוחצים על המשך.
  10. מזינים שם תיאורי למודל.
  11. לוחצים על יצירת מודל.

אחרי שיוצרים את המודל, בדף פרטי המודל מוצגות תווית האימון ותווית הסיווג שבחרתם.

אימון המודל

כדי לאמן את מודל ה-AI, צריך ליצור מערך נתונים לאימון ואז להתחיל את תהליך האימון הראשוני. במהלך הרצת אימון, המודל לומד מהדוגמאות במערך הנתונים.

אימון מחדש אוטומטי: אחרי הרצת האימון הראשונית, המודל עובר אימון מחדש כל שבועיים כדי לשפר את רמת הדיוק שלו או לשמור עליה. בכל שלב אפשר לאמן את המודל מחדש ידנית. אחרי כל הרצת אימון מתפרסם מודל חדש, והתזמון האוטומטי של האימון מחדש מתאפס לעוד שבועיים.

יצירת קבוצת נתונים לאימון

כדי ליצור מערך נתונים לאימון, המתייגים הייעודיים צריכים להוסיף את תווית האימון לפחות ל-100 קבצים לכל תווית אפשרית. לדוגמה, אם לתווית יש 3 אפשרויות – נניח 'לשימוש פנימי בלבד', 'סודי' ו'ציבורי' – צריך לפחות 300 קובצי אימון. עם זאת, מומלץ להוסיף יותר מ-100 קבצים לכל תווית אפשרית, כי סביר להניח שחלק מהקבצים לא יעמדו בדרישות של מערך הנתונים לאימון. מידע נוסף על יצירת תוויות לדוגמאות אימון באיכות גבוהה

הערה: מערך הנתונים לאימון יכול לכלול עד מיליון קבצים.

אחרי שיוצרים את המודל, הוא בודק באופן אוטומטי תוך כ-24 שעות כמה קבצים סומנו לצורך אימון. לאחר מכן, המערכת בודקת באופן רציף לאורך כל היום.

כדי לבדוק כמה קבצים סומנו בתווית:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה and then שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בקטע פעולות של המודל, בוחרים באפשרות הצגת פרטים.
  4. בחלונית שבראש הדף, בקטע קובצי אימון למודל פעיל, אפשר לראות את מספר הקבצים עם התוויות.

אם יש למודל מספיק קבצים לאימון, המצב יהיה 'מוכן לאימון'

הרצת אימון

בדרך כלל הרצת אימון נמשכת 4 עד 6 שעות, אבל היא יכולה להימשך יותר זמן במערכי נתונים גדולים יותר. כדי שהמודל ילמד לתייג את הקבצים בצורה מדויקת, כנראה שיהיה צריך להריץ כמה תהליכי אימון.

במהלך הרצת אימון, המודל משווה את הסיווג שהוא בוחר לקובץ לתווית האימון שמוחלת על הקובץ כדי ליצור ציונים. פרטים נוספים זמינים במאמר איך מחושבים הציונים.

אחרי הרצת אימון, אפשר לבדוק את רמת הדיוק של המודל.

כדי להריץ אימון:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה and then שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בחלונית ההדרכה בחלק העליון של הדף, לוחצים על התחלת הרצת אימון.

    הערה: הכפתור הזה זמין רק אם המתייגים הוסיפו תוויות למספר המינימלי של קבצים לאימון.

אחרי האימון: בדיקת ציוני המודל

אחרי הרצת אימון, המודל מתפרסם עם ציוני אחוזים לכל אפשרות של תווית. כל ציון, שנקרא ציון היזכרות, הוא אחוז הדוגמאות לאימון שהמודל סיווג בצורה נכונה אחרי שהוא בדק את עצמו:

  • מתחת ל-50% – רמת דיוק נמוכה. המודל צריך נתונים טובים יותר והוא עדיין לא מוכן.
  • ‫50% עד 80% – דיוק בינוני. יכול להיות שהמודל יהיה מוכן על בסיס מוגבל.
  • מעל 80% – רמת דיוק גבוהה. המודל מוכן לסיווג קבצים בארגון שלכם.

כדי לבדוק את רמת הדיוק של המודל אחרי הרצת אימון:

בדף פרטי המודל אפשר לראות את ציוני המודל:

  • בחלונית תוצאות האימון בחלק העליון של הדף, בקטע הקבצים והציונים הנוכחיים שנעשה בהם שימוש
  • בחלונית קבוצת הנתונים הנוכחית לאימון

הפעלת סיווג קבצים בעזרת AI

אחרי שמודל ה-AI מאומן להשגת רמת דיוק מינימלית (לפחות 50%), אפשר לבחור אפשרויות לתוויות ולהפעיל תיוג אוטומטי של קבצים, או החלה אוטומטית. עם זאת, כדי להשיג את התוצאות הכי טובות, מומלץ להמתין עד שציוני המודל של כל אפשרויות התיוג יגיעו ל-80% לפחות.

כדי להפעיל את היישום האוטומטי

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה and then שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בחלונית ההדרכה, לוחצים על הגדרה של החלת המלצות באופן אוטומטי.

    הערה: הלחצן הזה זמין רק אם לפחות אפשרות אחת של תוויות הגיעה לרמת דיוק של 50%.

    לחלופין, אם הגדרתם בעבר יישום אוטומטי, בקטע קבצים שמסומנים בתווית AI, לוחצים על עריכת היישום האוטומטי.

  5. מסמנים את התיבות שלצד אפשרויות התוויות שרוצים לאפשר למודל ה-AI ליישם אוטומטית.
  6. כדי לבחור יחידות ארגוניות או קבוצות ספציפיות שהקבצים שבהן יקבלו תוויות אוטומטיות מהמודל, לוחצים על שמירה והמשך. הגדרת ברירת המחדל היא ארגון ההורה ברמה העליונה.

    אפשר גם ללחוץ על שמירה כדי לבחור משתמשים מאוחר יותר.

  7. אם בחרתם באפשרות 'בחירת משתמשים', בצד, בוחרים יחידה ארגונית או קבוצת משתמשים.

    ההגדרות של קבוצות מבטלות את ההגדרות של היחידות הארגוניות. מידע נוסף

  8. לוחצים על מופעל – התווית מוחלת באופן אוטומטי עם אחת מהאפשרויות שלמטה.
  9. לוחצים על שמירה.

    בדף פרטי המודל, הסטטוס של ההחלה האוטומטית הנוכחית של הכלל הוא מופעל.

הערה: אפשר לעקוב אחרי סיווג קבצים בעזרת AI באמצעות יומן האירועים של Drive. פרטים נוספים זמינים בקטע מעקב אחרי אירועים של תוויות סיווג קבצים בעזרת AI בהמשך הדף.

כשסיווג קבצים בעזרת AI סורק קבצים

אחרי שמפעילים את היישום האוטומטי לקבצים בבעלות המשתמשים ולאחסון שיתופי, סיווג ה-AI סורק את הקבצים (במצב מנוחה) לפחות פעם אחת תוך שבוע עד שבועיים. סיווג באמצעות AI סורק גם קבצים בכל פעם שהם מועלים או משתנים, ויכול לשנות את התווית שהוחלה אם התוכן של הקובץ משתנה.

איך המערכת מטפלת בסתירות בין כללים שמוחלים באופן אוטומטי

כללי הגנה על נתונים

ערכי התוויות שמוגדרים על ידי כללי הגנה על נתונים מקבלים עדיפות על פני סיווג קבצים בעזרת AI, ושניהם מקבלים עדיפות על פני סיווג ברירת מחדל.

מספר כללים

אם 2 כללים או יותר מאותו סוג מנסים להחיל על אותו קובץ אפשרויות שונות של תוויות, תוחל האפשרות שמופיעה גבוה יותר ברשימת האפשרויות של התווית. לדוגמה, יכול להיות שיש לכם תווית עם שדה שכולל 3 אפשרויות במרכז ניהול התוויות:

  1. סודי
  2. פנימי
  3. גלוי לכולם

אם כלל 1 מנסה להגדיר את התווית כסודית וכלל 2 מנסה להגדיר את התווית כציבורית לאותו קובץ, התווית סודית תוחל. לפני שמגדירים כללים, חשוב לוודא שאפשרויות השדה של התווית מופיעות בסדר העדיפות המועדף.

תוויות שהמשתמשים מוסיפים

לתוויות שמשתמשים מוסיפים לקבצים יש עדיפות על פני תוויות שנוספו באמצעות AI. כלומר, סיווג קבצים בעזרת AI לא משנה תוויות שמשתמשים הגדירו בעבר.

מעקב אחרי המודל

פרטים על האופן שבו סיווג קבצים בעזרת AI מתייג קבצים ביומן האירועים של Drive. לכל אפשרות של תווית, ביומן מוצג מספר הקבצים שסווגו באמצעות החלה אוטומטית ומספר המשתמשים שאישרו את התווית שהוחלה אוטומטית או שינו אותה. למשתמשים צריכות להיות הרשאות כדי לבצע פעולות על תוויות שמוחלות באופן אוטומטי.

ההרשאות שנדרשות למשתמשים כדי ליצור אינטראקציה עם תוויות שהוחלו באופן אוטומטי

כדי לבצע פעולות בתוויות שהמערכת החילה באופן אוטומטי, המשתמשים צריכים הרשאות לקובץ ולתווית. אפשר להגדיר הרשאות לתווית הסיווג במרכז ניהול התוויות. פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.

  • כדי לראות תוויות שנוספו אוטומטית, המשתמשים צריכים לקבל את ההרשאה אפשר לראות את התווית הזו לתווית הסיווג.
  • כדי לאשר ולשנות תוויות שנוספו באופן אוטומטי, המשתמשים צריכים את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים לתווית הסיווג, וצריכה להיות להם הרשאת עריכה או בעלות על הקובץ.

הצגת אירועי סיווג קבצים בעזרת AI ביומן האירועים של Drive

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה and then שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע קבצים עם תוויות AI, בוחרים באפשרות הצגת קבצים של אפשרות התווית שרוצים לראות את האירועים שלה.

    הכלי לחקירת אבטחה נפתח בכרטיסייה חדשה, ומוצגות בו תוצאות החיפוש ביומן האירועים של Drive לגבי שני אירועים שקשורים לסיווג באמצעות AI: התווית הוחלה והערך של שדה התווית השתנה.

  4. לוחצים על תיאור האירוע כדי לקבל פרטים נוספים, כמו:
    • השם והסוג של המסמך שסומן
    • הערך של שדה התווית שהוקצה למסמך (לדוגמה, סודי או מוגבל)

ניהול המודל

השבתת ההחלה האוטומטית של תווית סיווג

כדי להשבית את ההחלה האוטומטית לכל האפשרויות של התוויות או רק לאפשרויות ספציפיות:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה and then שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בקטע קבצים עם תוויות שנוצרו על ידי AI, לוחצים על עריכת ההחלה האוטומטית.
  5. מבטלים את הסימון בתיבות של אפשרויות התוויות שרוצים להשבית את ההוספה האוטומטית שלהן.

    כדי להשהות לחלוטין את ההוספה האוטומטית, צריך לבטל את הסימון בכל האפשרויות.

כדי להשבית לחלוטין את ההחלה האוטומטית ביחידות ארגוניות או בקבוצות ספציפיות:

אפשר להשבית לגמרי את ההחלה האוטומטית על תוכן בבעלות המשתמשים ביחידות ארגוניות או בקבוצות ספציפיות.

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה and then שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בתפריט פעולות נוספות בראש הדף, לוחצים על ניהול יישום אוטומטי ואז עדכון של יחידות ארגוניות או קבוצות שהופעלו.
  5. בצד ימין, לוחצים על יחידה ארגונית או קבוצה כדי לבחור אותה.
  6. בוחרים באפשרות מושבת – התווית לא מוחלת באופן אוטומטי.
  7. לוחצים על שמירה.

מחיקת מודל

יכול להיות שתצטרכו למחוק מודל – למשל, אם דיוק המודל לא משתפר. אם מוחקים מודל, כל הגדרות סיווג קבצים בעזרת AI שלו מוסרות באופן סופי. הערה:

  • התוויות שנעשה בהן שימוש רק במודל הזה יוסרו מהגדרות הסיווג, וכל הגרסאות של המודל יימחקו.
  • תוויות האימון יישארו בקבצים. אחרי שמוחקים את המודל, אפשר להגדיר מודל חדש לשימוש באותה תווית אימון (או בתווית אחרת).
  • כל החלת תוויות אוטומטית שהפעלתם למודל הזה תופסק מיד, אבל תוויות שכבר הוחלו באופן אוטומטי יישארו בקבצים.
  • אם משאירים את תווית האימון וקובצי האימון הקיימים, תוצאות המודל יהיו דומות.
  • אם יוצרים מחדש את אותה תווית סיווג למודל חדש, תכונת סיווג קבצים בעזרת AI מתעלמת מהסיווגים של מודלים קודמים ומחליפה אותם. כך תוכלו לעבד מחדש את הקבצים של הארגון ב-Drive. האפשרות הזו יכולה להיות שימושית אם ביצעתם שיפורים משמעותיים באיכות המודל מאז הפריסה הראשונית.

כדי למחוק מודל:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחה and then שליטה בגישה ובנתונים ואז סיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג קבצים בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בדף פרטי המודל, בקטע פעולות בצד שמאל, לוחצים על מחיקת המודל.

    בתיבת הדו-שיח מחיקת המודל מפורטים ההשפעות של מחיקת המודל.

  5. כדי להמשיך, לוחצים על מחיקת המודל.

שאלות נפוצות

תוויות אימון וסיווג

מהן הדרישות לתוויות סיווג ולתוויות אימון?

גם תוויות הסיווג וגם תוויות האימון צריכות לעמוד בקריטריונים הבאים:

  • צריך להוסיף לפחות 2 אפשרויות ולא יותר מ-7 אפשרויות.
  • האפשרויות שלהם צריכות להיות באותו סדר.

    לדוגמה, אם לתווית הסיווג יש אפשרויות בסדר הזה:

    1. אפשרות 1
    2. אפשרות 2
    3. אפשרות 3

    אי אפשר לסדר את האפשרויות של תווית האימון באופן הבא:

    1. אפשרות 2
    2. אפשרות 1
    3. אפשרות 3
  • חובה לפרסם את האפליקציה.
  • להשתמש בתוויות עם הרשאות גישה שונות. תווית האימון צריכה להיות זמינה רק לאנשים בארגון שיכולים להוסיף תוויות, כדי שהם יוכלו לאמן את המודל. יכול להיות שלתווית הסיווג יש גישה רחבה יותר.

איך יוצרים תווית אימון באופן ידני?

מומלץ ליצור את תווית האימון באופן אוטומטי כשמגדירים את המודל, אבל אפשר גם ליצור אותה באופן ידני במרכז ניהול התוויות. כדי לעשות את זה, צריך לפעול לפי ההנחיות הבאות:
  • מוודאים שהתווית עומדת בקריטריונים הנדרשים לתווית.
  • כדי שהמתייגים הייעודיים יוכלו לזהות את תווית האימון ולהחיל אותה בקלות כשיוצרים את מערך נתוני האימון, כדאי להוסיף לתווית את המילה train או training.
  • מוסיפים שדה תיאור לתווית האימון כדי לעזור עוד יותר למי שמוגדרים לתייג להבין את המטרה שלה.
  • חשוב להגדיר את הרשאות התווית לרק המתייגים הייעודיים שלכם – כלומר, אלה שיזהו קבצים לאימון המודל – באמצעות הגדרות לקבוצת משתמשים שיצרתם למתייגים. למשתמשים שמוסיפים תוויות צריכה להיות הרשאה מסוג אפשרות להחיל תוויות ולהגדיר עבורן ערכים. פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.

האם אפשר להשתמש בתווית הסיווג כתווית אימון?

לא, תווית הסיווג ותווית האימון חייבות להיות שונות. התווית שבחרתם כתווית סיווג לא זמינה כתווית אימון.

מערכי נתונים לאימון

אילו קבצים מתאימים לאימון המודל?

כדי לקבל את התוצאות הטובות ביותר באימון המודל, חשוב שהאנשים בארגון שיכולים להוסיף תוויות יפעלו לפי ההנחיות הבאות:

  • ודאו שכל קובץ מכיל לפחות 500 תווים.
  • בוחרים קבצים שמייצגים תוכן שהמשתמשים יוצרים, משתפים ומשתמשים בו בארגון.
  • מומלץ להוסיף תווית למספר דומה של קבצים לכל אפשרות של תווית, עם מינימום של 100 קבצים לכל אפשרות. כך המודל יכול להבין את הנתונים בצורה מקיפה ולשפר את הציונים.
  • צריך לכלול מגוון מייצג של קבצים לכל סוג אפשרות. לדוגמה, אל תסמנו 100 קורות חיים כקבוצה הכוללת של קבצים לדוגמה לסיווג 'סודי ביותר' אם חוזים הם גם סוג קובץ נפוץ עם הסיווג 'סודי ביותר' בארגון שלכם.
  • החלת התווית של ההדרכה רק על קבצים שנמצאים בבעלות הארגון, בין אם הם בבעלות ישירה של משתמשים או מאוחסנים בתיקיות אחסון שיתופי. סיווג קבצים בעזרת AI לא מעבד קבצים שנמצאים בבעלות של משתמשים חיצוניים או באחסון שיתופי חיצוני.

האם אפשר לאמן את המודל על קבצים שכבר תויגו?

בשלב הזה, אי אפשר לאמן את המודל על קבצים שסומנו בעבר. כדי שהמודל יוכל להחיל תווית באופן אוטומטי על קבצים, צריך להגדיר תווית אימון שהיא רפליקה של התווית הזו, אבל אי אפשר להשתמש באותה תווית.

האם אפשר לאמן את המודל בכמה שפות?

המודל תומך בכמה שפות, אבל צריך לכלול בנתוני האימון מדגם מייצג של קבצים לכל סוג אפשרות ושפה. כך גדל מספר הקבצים שנדרשים לאימון המודל. יש תמיכה רק בשפות שמבוססות על תווי לטינית.

איך הציונים מחושבים במהלך ההדרכה?

במהלך האימון, מודל ה-AI משתמש ב-75% מנתוני הקלט כדי לאמן את עצמו איך לתייג קבצים, ושומר 25% מהנתונים כדי לבדוק את הביצועים שלו מעת לעת. במילים אחרות, לגבי 25% מהקבצים המתויגים, המודל מנתח את הקבצים האלה כאילו הוא לא יודע איזו תווית הוחלה עליהם. לאחר מכן, מודל ה-AI בוחר תווית משלו ומשווה את הבחירה הזו לתווית בפועל שהמתייג הייעודי הוסיף. הציונים מראים את החלק היחסי של הקבצים השמורים שהמודל הקצה להם את התווית הנכונה.

אחרי שאני מאמן מודל, האם אפשר "להקפיא" אותו כדי להפסיק את האימון מחדש באופן אוטומטי?

מודלים של סיווג קבצים בעזרת AI מתאמנים באמצעות קבצים ב-Drive. כשקבצים כאלה נמחקים (לרוב לפי לוחות זמנים לשמירת נתונים דרך Google Vault), צריך למחוק גם את המודל כדי לוודא שהתוכן של הקבצים לא יישמר בצורה כלשהי. מסיבה זו, אימון מחדש של המודל מתבצע בלולאה רציפה ואי אפשר להשהות אותו.

האם משתמשים יכולים לשנות או לתקן תוויות וערכים בשדות?

משתמשים עם הרשאה יכולים לעדכן תווית או ערך בשדה, אבל סיווג קבצים בעזרת AI לא משנה את מודל הסיווג על סמך השינוי הזה. אם שמתם לב שהמודל הוסיף תוויות וערכי שדות בצורה שגויה, אתם יכולים לבקש מהמתייגים הייעודיים להקצות לקבצים את תווית האימון הנכונה. לאחר מכן, סיווג קבצים בעזרת AI משלב את הנתונים האלה במחזור הבא של אימון עצמי של המודל.

הוספה אוטומטית

האם סיווג קבצים בעזרת AI יכול להעריך תמונות, סרטונים וקובצי אודיו?

סיווג קבצים בעזרת AI משתמש באותו עיבוד של טקסט שניתן לאינדוקס כמו ב-DLP ב-Drive. אפשר להעריך כל קובץ שממנו Drive יכול לחלץ טקסט שניתן לאינדוקס, כדי להחיל עליו תוויות סיווג באמצעות AI. היא כוללת זיהוי תווים אופטי (OCR) לחילוץ טקסט מתמונות. עם זאת, סיווג קבצים בעזרת AI לא בודק קובצי וידאו או אודיו.

האם סיווג קבצים בעזרת AI פועל רק כדי להוסיף תוויות לתוכן רגיש?

התכונה 'סיווג קבצים בעזרת AI' מתמקדת בעיקר בתוכן רגיש, אבל אפשר לאמן כל תווית עם עד 4 אפשרויות לתיוג אוטומטי. תוויות סיווג משמשות גם לביקורת, לשיפור יכולת החיפוש ולניהול השמירה.

האם סיווג קבצים בעזרת AI פועל כשההצפנה מצד הלקוח (CSE) מופעלת?

מכיוון ש-Google לא יכולה לפענח קבצים שהוצפנו באמצעות CSE (רק מפתח ההצפנה הפרטי שלכם יכול), סיווג קבצים בעזרת AI לא יכול להתאמן על קבצים שהוצפנו באמצעות CSE ולא יכול להחיל תוויות על הקבצים האלה באופן אוטומטי.

איך ומתי סיווג קבצים בעזרת AI משנה את התוויות שנוספו אוטומטית?

אחרי שמפעילים את ההחלה האוטומטית, סיווג קבצים בעזרת AI סורק ומסווג את כל הקבצים במצב מנוחה שמהם הוא יכול לחלץ מספיק טקסט. הקבצים האלה נסרקים לפחות פעם אחת.

סיווג הקבצים בעזרת AI מעבד מחדש קבצים באופן תקופתי כשהתוכן משתנה. שינויים בתוכן עשויים להוביל לחיזוי שונה של קובץ. אם סיווג קבצים בעזרת AI מזהה אפשרות ישנה ואפשרות חדשה לקובץ, הוא יבחר באפשרות שמופיעה גבוה יותר ברשימת האפשרויות. לדוגמה, אם בשדה יש שלוש אפשרויות שמופיעות במרכז ניהול התוויות:

  • סודי
  • פנימי
  • גלוי לכולם

נניח שסיווג קבצים בעזרת AI מסווג קובץ כפנימי, והתוכן משתנה כך שמודל סיווג ה-AI חוזה סודי. במקרה הזה, הסיווג של הקובץ ישתנה לסודי. עם זאת, אם המודל לסיווג קבצים בעזרת AI חוזה שהסיווג הוא גלוי לכולם, הסיווג של הקובץ יישאר פנימי.

סיווג קבצים בעזרת AI לא משנה תוויות שהוחלו אוטומטית וערכים בשדות שנבדקו או שונו על ידי משתמשים.

אם המודל משתנה, האם המודל מעריך מחדש קבצים קיימים באופן אוטומטי?

הקבצים שלכם מעובדים על ידי המודל העדכני ביותר כשהם נוצרים או משתנים. כשמתפרסמת גרסה חדשה של מודל, קבצים קיימים לא עוברים עיבוד מחדש באופן אוטומטי. עם זאת, יכול להיות שהמודל יעבד מחדש את כל הקבצים שלכם מעת לעת עם הגרסה העדכנית, ללא קשר לעדכונים ספציפיים של המודל או לאימון מחדש.

האם סיווג קבצים בעזרת AI מקבל עדיפות על פני שיטות סיווג אחרות כשיש כמה שיטות פעילות?

אפשר לבטל את סיווג הנתונים. סיווג הנתונים מתבצע לפי הסדר הבא:
  1. כלל DLP ללא החלפה של משתמש
  2. סיווג ידני
  3. כלל DLP עם שינוי של משתמש
  4. סיווג קבצים בעזרת AI
  5. סיווג ברירת המחדל
הסרה של תווית או שדה מאפשרת למנגנון סיווג ברמה נמוכה יותר לפעול. לדוגמה, אם משתמש מסיר תווית מקובץ, יכול להיות שסיווג קבצים בעזרת AI יוסיף את אותה תווית לקובץ מאוחר יותר.

לאילו סוגים של קבצים אפשר להוסיף תוויות סיווג קבצים בעזרת AI?

  • סיווג קבצים בעזרת AI משתמש באותו עיבוד של טקסט שניתן לאינדוקס כמו ב-DLP ב-Drive. פרטים נוספים מופיעים ברשימת סוגי הקבצים שנסרקים על ידי DLP. אין תמיכה בקובצי אודיו ווידאו.
  • כדי שסיווג קבצים בעזרת AI יוסיף תווית לקובץ, הקובץ צריך להכיל כמות מינימלית של טקסט. כתוצאה מכך, יכול להיות שקבצים מסוימים, כמו מסמכים קצרים מאוד ותמונות עם כמויות קטנות של טקסט, לא יסווגו.

מה קורה כשמשביתים אפשרות להחלה אוטומטית?

במהלך הסריקה, אם המערכת חוזה שלקובץ יש אפשרות שהיישום האוטומטי שלה מושבת, סיווג ה-AI לא מוסיף לקובץ תוויות או ערכי שדות.

קבצים שסיווג קבצים בעזרת AI הוסיף להם תוויות בעבר ישמרו את התווית ואת ערכי האפשרויות גם אחרי שהאפשרות מושבתת.

האם אפשר לבטל את ההחלה האוטומטית של תוויות?

אי אפשר לבטל את החלת התוויות. מומלץ לחדד ולבדוק את המודלים עם קהל קטן לפני שמבצעים פריסה רחבה. לדוגמה, אתם יכולים לאמן את המודלים עם תווית זמנית. אחרי שהביצועים של המודל משביעי רצון, אפשר 'לאפס' את המודל על ידי מחיקתו ויצירת מודל חדש עם אותה תווית אימון (אותו אוסף נתוני אימון), אבל עם התווית הקבועה.

רישוי

איך התכונה פועלת אצל משתמשים שאין להם רישיון מתאים?

אם לאדמין בארגון שלכם יש רישיון שתומך בסיווג קבצים בעזרת AI, הוא יכול לאמן מודל. למתייגים ייעודיים (המשתמשים שמחילים את תווית האימון) לא צריך להיות רישיון עם סיווג קבצים בעזרת AI.

הבעלות על קבצים עם תווית אימון יכולה להיות של כל משתמש שיש לו רישיון שתומך בתוויות סיווג ב-Drive. עם זאת, סיווג קבצים בעזרת AI מוסיף תוויות רק לקבצים שנמצאים באחסון שיתופי או בבעלות של משתמשים עם רישיונות שתומכים בסיווג קבצים בעזרת AI. קבצים שנמצאים בבעלות משתמשים שאין להם רישיון נתמך לא יעברו עיבוד על ידי סיווג קבצים בעזרת AI.

אם לאף משתמש אין רישיון שתומך בסיווג קבצים בעזרת AI, היישום האוטומטי מושבת ומודל הסיווג נמחק. עם זאת, תוויות אימון ותוויות שמוחלות על ידי סיווג קבצים בעזרת AI נשארות בקבצים.

איך התכונה פועלת עבור משתמשים שהועברו לארכיון?

הקבצים של משתמשים עם רישיון ל-Google Workspace Enterprise Plus – Archived User יסומנו על ידי סיווג קבצים בעזרת AI.

איך מתחילים לעבוד כאדמינים של תוויות ב-Drive