הוספה אוטומטית של תוויות לקבצים ב-Google Drive באמצעות סיווג בעזרת AI

התכונה הזו כלולה ב-Frontline Plus וב-Enterprise Plus. היא כלולה גם בתוספים Gemini Enterprise–Legacy,‏ Gemini Education Premium ו-AI Security. השוואה בין תוספים

סיווג באמצעות AI יכול לתייג באופן אוטומטי את התוכן הרגיש של הארגון ב-Google Drive באמצעות מודלים של AI בהתאמה אישית שהארגון מאמן, ללא צורך בתכנות. אדמינים קובעים על אילו נתונים המודלים מתאמנים, כך שכל מודל הוא ייחודי לארגון שלכם ורק הארגון שלכם יכול להשתמש בו. אתם יכולים ליצור עד 5 מודלים ייחודיים של סיווג AI לארגון שלכם.

אתם יכולים להשתמש בקבצים שסווגו על ידי AI במדיניות אבטחה כמו כללי הגנה על נתונים, Vault ועוד.

הערה: כדי שסיווג ה-AI יוסיף תוויות לקבצים, הם צריכים להיות בתיקיות אחסון שיתופי או בבעלות של משתמשים עם רישיונות שתומכים בתוויות סיווג.

סקירה כללית על סיווג בעזרת AI

אלה השלבים הבסיסיים להגדרת סיווג באמצעות AI כדי להוסיף תוויות לקבצים חדשים וקיימים ב-Drive באופן אוטומטי.

1. יצירת מודל: קודם בוחרים או יוצרים תווית סיווג, שמודל ה-AI יחיל באופן אוטומטי על קבצים אחרי שהוא יעבור אימון. אתם גם יוצרים את תווית האימון, שמשמשת לאימון המודל לזיהוי התוכן הרגיש של הארגון. אחר כך יוצרים מודל AI כדי להשתמש בתוויות האלה.

2. אימון המודל: אחרי שיוצרים את התוויות, מתייגים ייעודיים מסווגים קבצים ב-Drive באמצעות תווית האימון כדי ליצור את מערך נתוני האימון. לאחר מכן המודל משתמש במערך הנתונים כדי ללמוד איך לסווג קבצים רגישים.

3. הפעלת סיווג באמצעות AI: אחרי שהמודל מאומן, אפשר להגדיר תיוג אוטומטי של קבצים, שנקרא החלה אוטומטית. במהלך ההגדרה, בוחרים אילו אפשרויות של תוויות להפעיל ומי המשתמשים שבבעלותם הקבצים שרוצים שסיווג ה-AI יחיל עליהם תוויות. לאחר מכן המודל מתחיל לתייג באופן אוטומטי קבצים רגישים.

4. מעקב אחרי המודל: אפשר להשתמש ביומן האירועים של Drive כדי לעקוב אחרי מספר הקבצים שסווגו, וגם אחרי מספר המשתמשים שאישרו או שינו תווית שהוחלה אוטומטית (אם יש להם הרשאות).

לפני שמתחילים

יצירת מודל

כדי ליצור מודל, קודם צריך לבחור תווית סיווג קיימת או ליצור תווית חדשה. לאחר מכן, צריך ליצור תווית אימון תואמת – באופן אוטומטי (מומלץ) או באופן ידני באמצעות מנהל התוויות – שהמתייגים הייעודיים ישתמשו בה.

בחירה או יצירה של תווית סיווג

צריך להפעיל את הסיווג ב-Drive וב-Docs. אחרי האימון, מודל ה-AI מחיל באופן אוטומטי את תווית הסיווג על קבצים רגישים ב-Drive. המודל מאומן על שדה אחד בלבד לכל תווית, שחייב להיות רשימת תגים או רשימת אפשרויות.

מומלץ להשתמש בתווית רגישות עם תיוג, כי היא מוצגת בצורה בולטת במסמכים:

כשמשתמשים בשדה של רשימת אפשרויות או רשימת תגים לתווית סיווג, השדה צריך:

  • להכיל לפחות 2 אפשרויות ועד 7 אפשרויות
  • לפרסם

אם יש לכם תווית קיימת שעומדת בדרישות האלה, אתם יכולים להשתמש בה כתווית סיווג. אחרת, אפשר להשתמש במנהל התוויות כדי ליצור תווית, לפני או במהלך הגדרת המודל (בהמשך הדף). פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.

יצירת תווית אימון

תווית האימון כמעט זהה לתווית הסיווג, והיא משמשת רק למטרות אימון על ידי מתייגים ייעודיים. כשיוצרים את המודל (בהמשך הדף הזה), אפשר ליצור אוטומטית את תווית האימון כדי לוודא שהיא תואמת לתווית הסיווג.

אפשר גם ליצור תווית אימון משלכם באופן ידני באמצעות המרכז לניהול תוויות, לפני הגדרת המודל או במהלך ההגדרה. פרטים נוספים מופיעים בהמשך הדף בקטע איך יוצרים ידנית תוויות לאימון?

יצירת המודל

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחהand thenשליטה בגישה ובנתוניםואזסיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג באמצעות AI, לוחצים על יצירת מודל.
  3. ברשימה תווית סיווג, בוחרים תווית סיווג קיימת ושדה לאימון המודל, או לוחצים על יצירת תווית כדי ליצור תווית באמצעות מנהל התוויות.

    אם יצרתם תווית במנהל התוויות, חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את התווית החדשה ברשימה.

  4. כדי לבחור את תווית הסיווג, בוחרים את השדה המתאים שרוצים להשתמש בו ברשימה שם השדה.
  5. לוחצים על המשך.
  6. (אופציונלי) אפשר ליצור ולפרסם באופן אוטומטי תווית אימון שתואמת לתווית הסיווג:
    1. לוחצים על יצירת תווית אימון.
    2. לוחצים על עדכון הרשאות התווית בהודעה שמופיעה. התווית נפתחת במצב עריכה במנהל התוויות בכרטיסייה נפרדת.
    3. לוחצים על הרשאותואזעריכה, ואז מעניקים את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים לקבוצת ההגדרות שמכילה את המסמכים שמוסיפים להם תוויות.
    4. לוחצים על שמירה וסוגרים את הכרטיסייה של המרכז לניהול תוויות.

      הערה: אפשר גם להגדיר הרשאות לתוויות מאוחר יותר. אבל חשוב שרק למתייגים תהיה גישה לתווית האימון.

  7. (אופציונלי) אם כבר יצרתם תווית אימון, בוחרים אותה ברשימה תווית אימון.
  8. (אופציונלי) כדי ליצור תווית אימון משלכם, לוחצים על מעבר למנהל התוויות.

    חשוב: חשוב לוודא שהתווית עומדת בקריטריונים של תוויות אימון, ולהגדיר את הרשאות הגישה לתווית כך שרק המתייגים יוכלו לגשת אליה. פרטים נוספים מופיעים בהמשך הדף בקטע הנחיות לגבי תוויות הדרכה.

    חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את תווית האימון החדשה ברשימה.

  9. בדף יצירת מודל, לוחצים על המשך.
  10. מזינים שם תיאורי למודל.
  11. לוחצים על יצירת מודל.

אחרי שיוצרים את המודל, בדף פרטי המודל מוצגות תווית האימון ותווית הסיווג שבחרתם.

אימון המודל

כדי לאמן את מודל ה-AI, צריך ליצור מערך נתונים לאימון ואז להתחיל את ריצת האימון הראשונית שלו. במהלך הרצת אימון, המודל לומד מהדוגמאות במערך הנתונים.

האימון מחדש הוא אוטומטי: אחרי הרצת האימון הראשונית, המודל עובר אימון מחדש כל שבועיים כדי לשפר את רמת הדיוק שלו או לשמור עליה. בכל שלב אפשר לאמן את המודל מחדש ידנית. אחרי כל הרצת אימון מתפרסם מודל חדש, והתזמון האוטומטי של האימון מחדש מתאפס לעוד שבועיים.

יצירת קבוצת נתונים לאימון

כדי ליצור מערך נתונים לאימון, המתייגים הייעודיים צריכים להוסיף את תווית האימון ל-100 קבצים לפחות לכל תווית אפשרית. לדוגמה, אם לתווית יש 3 אפשרויות – 'לשימוש פנימי בלבד', 'סודי' ו'ציבורי' – צריך לפחות 300 קובצי אימון. אבל מומלץ להוסיף יותר מ-100 קבצים לכל תווית אפשרית, כי סביר להניח שחלק מהקבצים לא יעמדו בדרישות של מערך הנתונים לאימון. מידע נוסף על יצירת תוויות לדוגמאות אימון באיכות גבוהה

הערה: מערך הנתונים לאימון יכול לכלול עד מיליון קבצים.

אחרי שיוצרים את המודל, הוא בודק באופן אוטומטי תוך כ-24 שעות כמה קבצים סומנו לצורך אימון. לאחר מכן, המערכת בודקת באופן רציף לאורך כל היום.

כדי לבדוק כמה קבצים סומנו בתווית:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחהand thenשליטה בגישה ובנתוניםואזסיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בקטע פעולות של המודל, בוחרים באפשרות הצגת פרטים.
  4. בחלונית שבראש הדף, בקטע קובצי אימון למודל פעיל, אפשר לראות את מספר הקבצים עם התוויות.

אם יש למודל מספיק קבצים לאימון, המצב יהיה 'מוכן לאימון'

הרצת אימון

בדרך כלל, הרצת אימון נמשכת 4 עד 6 שעות, אבל היא יכולה להימשך יותר זמן אם מערכי הנתונים גדולים יותר. כדי שהמודל ילמד לתייג את הקבצים בצורה מדויקת, כנראה שיהיה צריך להריץ כמה תהליכי אימון.

במהלך הרצת אימון, המודל משווה את הסיווג שהוא בוחר לקובץ לתווית האימון שמוחלת על הקובץ כדי ליצור ציונים. פרטים נוספים זמינים במאמר איך מחושבים הציונים.

אחרי הרצת אימון, אפשר לבדוק את רמת הדיוק של המודל.

כדי להריץ אימון:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחהand thenשליטה בגישה ובנתוניםואזסיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בחלונית ההדרכה בחלק העליון של הדף, לוחצים על התחלת הרצת הדרכה.

    הערה: הלחצן הזה זמין רק אם המתייגים הוסיפו תוויות למספר המינימלי של קובצי אימון.

אחרי האימון: בדיקת ציוני המודל

אחרי הרצת אימון, המודל מתפרסם עם ציוני אחוזים לכל אפשרות של תווית. כל ציון, שנקרא ציון היזכרות, הוא אחוז הדוגמאות לאימון שהמודל סיווג בצורה נכונה אחרי שהוא בדק את עצמו:

  • מתחת ל-50% – רמת דיוק נמוכה. המודל צריך נתונים טובים יותר והוא עדיין לא מוכן.
  • 50% עד 80% – דיוק בינוני. יכול להיות שהמודל יהיה מוכן על בסיס מוגבל.
  • מעל 80% – רמת דיוק גבוהה. המודל מוכן לסיווג קבצים בארגון שלכם.

כדי לבדוק את רמת הדיוק של המודל אחרי הרצת אימון:

בדף פרטי המודל אפשר לראות את ציוני המודל:

  • בחלונית תוצאות האימון בחלק העליון של הדף, בקטע הקבצים והציונים הנוכחיים שנעשה בהם שימוש
  • בחלונית קבוצת הנתונים הנוכחית לאימון

הפעלת סיווג AI

אחרי שמודל ה-AI מאומן להשגת רמת דיוק מינימלית (לפחות 50%), אפשר לבחור אפשרויות לתוויות ולהפעיל תיוג אוטומטי של קבצים, או החלה אוטומטית. עם זאת, כדי להשיג את התוצאות הכי טובות, מומלץ להמתין עד שהציונים של המודל לכל אפשרויות התוויות יגיעו ל-80% לפחות.

כדי להפעיל את היישום האוטומטי

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחהand thenשליטה בגישה ובנתוניםואזסיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בחלונית ההדרכה, לוחצים על הגדרה של החלה אוטומטית.

    הערה: הלחצן הזה זמין רק אם לפחות אפשרות אחת של תוויות הגיעה לדיוק של 50%.

    לחלופין, אם הגדרתם בעבר יישום אוטומטי, בקטע קבצים שמסומנים בתווית AI, לוחצים על עריכת היישום האוטומטי.

  5. מסמנים את התיבות שלצד אפשרויות התוויות שרוצים לאפשר למודל ה-AI להחיל באופן אוטומטי.
  6. כדי לבחור יחידות ארגוניות או קבוצות ספציפיות שהן הבעלים של הקבצים שהמודל צריך להחיל עליהם תוויות באופן אוטומטי, לוחצים על שמירה והמשך. הגדרת ברירת המחדל היא הארגון ההורה ברמה העליונה.

    אפשר גם ללחוץ על שמירה כדי לבחור משתמשים מאוחר יותר.

  7. אם בחרתם באפשרות 'בחירת משתמשים', בצד, בוחרים יחידה ארגונית או קבוצת משתמשים.

    ההגדרות של קבוצות מבטלות את ההגדרות של היחידות הארגוניות. מידע נוסף

  8. לוחצים על מופעל – התווית מוחלת באופן אוטומטי עם אחת מהאפשרויות שלמטה.
  9. לוחצים על שמירה.

    בדף פרטי המודל, הסטטוס של ההחלה האוטומטית הנוכחית של הכלל הוא מופעל.

הערה: אפשר לעקוב אחרי סיווג באמצעות AI באמצעות יומן האירועים של Drive. פרטים נוספים זמינים בקטע מעקב אחרי אירועים של תוויות סיווג מבוססות-AI בהמשך הדף.

כשסיווג ה-AI סורק קבצים

אחרי שמפעילים את היישום האוטומטי לקבצים בבעלות המשתמשים ולאחסון שיתופי, סיווג ה-AI סורק את הקבצים (במצב מנוחה) לפחות פעם אחת תוך שבוע עד שבועיים. סיווג באמצעות AI סורק גם קבצים בכל פעם שהם מועלים או משתנים, ויכול לשנות את התווית שהוחלה אם התוכן של הקובץ משתנה.

איך המערכת מטפלת בהתנגשויות בין כללים של יישום אוטומטי

כללי הגנה על נתונים

ערכי התוויות שמוגדרים על ידי כללי הגנה על נתונים מקבלים עדיפות על פני סיווג באמצעות AI, ושניהם מקבלים עדיפות על פני סיווג ברירת מחדל.

מספר כללים

אם 2 כללים או יותר מאותו הסוג מנסים להחיל אפשרויות שונות של תווית על אותו קובץ, תוחל האפשרות שמופיעה גבוה יותר ברשימת האפשרויות של התווית. לדוגמה, יכול להיות שיש לכם תווית עם שדה שכולל 3 אפשרויות במרכז ניהול התוויות:

  1. סודי
  2. פנימי
  3. גלוי לכולם

אם כלל 1 מנסה להגדיר את התווית כסודית, וכלל 2 מנסה להגדיר את התווית כציבורית לאותו קובץ, התווית סודית תוחל. לפני שמגדירים כללים, חשוב לוודא שאפשרויות השדה של התווית מופיעות בסדר העדיפות המועדף.

תוויות שהמשתמשים מוסיפים

התוויות שהמשתמשים מוסיפים לקבצים מקבלות עדיפות על פני תוויות שנוספו באמצעות AI. כלומר, סיווג באמצעות AI לא משנה תוויות שהמשתמשים הגדירו בעבר.

מעקב אחרי המודל

פרטים על האופן שבו סיווג באמצעות AI מתייג קבצים ביומן האירועים של Drive. לכל אפשרות של תווית, ביומן מוצג מספר הקבצים שסווגו באמצעות הוספה אוטומטית ומספר המשתמשים שאישרו את התווית שהתווספה אוטומטית או שינו אותה. למשתמשים צריכות להיות הרשאות כדי לבצע פעולות בתוויות שמוחלות אוטומטית.

ההרשאות שנדרשות למשתמשים כדי לבצע אינטראקציה עם תוויות שהוחלו באופן אוטומטי

כדי לבצע פעולות בתוויות שהמערכת החילה באופן אוטומטי, המשתמשים צריכים הרשאות לקובץ ולהרשאות לתווית. אפשר להגדיר הרשאות לתווית הסיווג במרכז ניהול התוויות. פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.

  • כדי לראות תוויות שנוספו אוטומטית, למשתמשים צריכה להיות הרשאה לראות את התווית הזו לתווית הסיווג.
  • כדי לאשר ולשנות תוויות שנוספו באופן אוטומטי, המשתמשים צריכים לקבל את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים לתווית הסיווג, וצריכה להיות להם הרשאת עריכה או בעלות על הקובץ.

הצגת אירועי סיווג באמצעות AI ביומן האירועים של Drive

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחהand thenשליטה בגישה ובנתוניםואזסיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע קבצים עם תוויות AI, בוחרים באפשרות הצגת קבצים עבור אפשרות התווית שרוצים לראות את האירועים שלה.

    הכלי לחקירת אבטחה נפתח בכרטיסייה חדשה, ומוצגות בו תוצאות חיפוש ביומן האירועים של Drive לגבי שני אירועים שקשורים לסיווג באמצעות AI: התווית הוחלה והערך של שדה התווית השתנה.

  4. לוחצים על תיאור האירוע כדי לקבל פרטים נוספים, כמו:
    • השם והסוג של המסמך שסומן
    • הערך של שדה התווית שהוקצה למסמך (לדוגמה, סודי או מוגבל)

ניהול המודל

השבתת ההחלה האוטומטית של תווית סיווג

כדי להשבית את ההחלה האוטומטית לכל האפשרויות של התוויות או רק לאפשרויות ספציפיות:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחהand thenשליטה בגישה ובנתוניםואזסיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בקטע קבצים עם תוויות שנוצרו על ידי AI, לוחצים על עריכת ההחלה האוטומטית.
  5. מבטלים את הסימון בתיבות של אפשרויות התוויות שרוצים להשבית את ההוספה האוטומטית שלהן.

    כדי להשהות לגמרי את ההוספה האוטומטית, צריך לבטל את הסימון בכל האפשרויות.

כדי להשבית לחלוטין את ההחלה האוטומטית ביחידות ארגוניות או בקבוצות ספציפיות:

אפשר להשבית לגמרי את ההחלה האוטומטית על תוכן בבעלות המשתמשים ביחידות ארגוניות או בקבוצות ספציפיות.

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחהand thenשליטה בגישה ובנתוניםואזסיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בתפריט פעולות נוספות בראש הדף, לוחצים על ניהול היישום האוטומטיואזעדכון של יחידות ארגוניות או קבוצות שהופעלו.
  5. בצד ימין, לוחצים על יחידה ארגונית או קבוצה כדי לבחור אותה.
  6. בוחרים באפשרות מושבת – התווית לא מוחלת באופן אוטומטי.
  7. לוחצים על שמירה.

מחיקת מודל

יכול להיות שתצטרכו למחוק מודל – למשל, אם דיוק המודל לא משתפר. אם מוחקים מודל, כל הגדרות סיווג ה-AI שלו מוסרות באופן סופי. הערה:

  • התוויות שנעשה בהן שימוש רק במודל הזה יוסרו מהגדרות הסיווג, וכל הגרסאות של המודל יימחקו.
  • תוויות האימון יישארו בקבצים. אחרי שמוחקים את המודל, אפשר להגדיר מודל חדש שישתמש באותה תווית אימון (או בתווית אחרת).
  • כל החלת תוויות אוטומטית שהפעלתם למודל הזה תופסק מיד, אבל תוויות שכבר הוחלו באופן אוטומטי יישארו בקבצים.
  • אם משאירים את תווית האימון וקובצי האימון הקיימים, תוצאות המודל יהיו דומות.
  • אם יוצרים מחדש את אותה תווית סיווג למודל חדש, תכונת הסיווג באמצעות AI מתעלמת מהסיווגים של מודלים קודמים ומחליפה אותם. כך תוכלו "לעבד מחדש" את הקבצים של הארגון שלכם ב-Drive. האפשרות הזו יכולה להיות שימושית אם ביצעתם שיפורים משמעותיים באיכות המודל מאז הפריסה הראשונית.

כדי למחוק מודל:

  1. במסוף Google Admin, נכנסים לתפריט ואז אבטחהand thenשליטה בגישה ובנתוניםואזסיווג נתונים לקטגוריות.

    כדי לעשות את זה צריך הרשאת אדמין לניהול תוויות סיווג.

  2. בקטע סיווג בעזרת AI, לוחצים על הצגת nn מודלים.
  3. בדף פרטי המודל, בקטע פעולות שמתייחס למודל, בוחרים באפשרות הצגת פרטים.
  4. בדף פרטי המודל, בקטע פעולות בצד שמאל, לוחצים על מחיקת המודל.

    בתיבת הדו-שיח מחיקת המודל מפורטים ההשפעות של מחיקת המודל.

  5. כדי להמשיך, לוחצים על מחיקת המודל.

שאלות נפוצות

תוויות אימון וסיווג

מהן הדרישות לתוויות האימון והסיווג?

גם תוויות הסיווג וגם תוויות האימון צריכות לעמוד בקריטריונים הבאים:

  • צריך להוסיף לפחות 2 אפשרויות ולא יותר מ-7 אפשרויות.
  • האפשרויות שלהם צריכות להיות באותו סדר.

    לדוגמה, אם האפשרויות של התווית לסיווג הנתונים מופיעות בסדר הזה:

    1. אפשרות 1
    2. אפשרות 2
    3. אפשרות 3

    אי אפשר לסדר את האפשרויות של תוויות האימון באופן הבא:

    1. אפשרות 2
    2. אפשרות 1
    3. אפשרות 3
  • חובה לפרסם את האפליקציה.
  • להשתמש בתוויות עם הרשאות גישה שונות. תווית האימון צריכה להיות זמינה רק לאנשים בארגון שיכולים להוסיף תוויות, כדי שהם יוכלו לאמן את המודל. יכול להיות שלתווית הסיווג יש גישה רחבה יותר.

איך יוצרים תווית אימון באופן ידני?

מומלץ ליצור את תווית האימון באופן אוטומטי כשמגדירים את המודל, אבל אפשר גם ליצור אותה באופן ידני במרכז ניהול התוויות. כדי לעשות את זה, צריך לפעול לפי ההנחיות הבאות:
  • מוודאים שהתווית עומדת בקריטריונים הנדרשים לתווית.
  • כדי שהמתייגים הייעודיים יוכלו לזהות את תווית האימון ולהחיל אותה בקלות כשיוצרים את מערך נתוני האימון, כדאי להוסיף לתווית את המילה train או training.
  • מוסיפים שדה תיאור לתווית האימון כדי לעזור עוד יותר למתייגים המיועדים להבין את המטרה שלה.
  • חשוב להגדיר את הרשאות התווית לרק המתייגים הייעודיים שלכם – כלומר, אלה שיזהו קבצים לאימון המודל – באמצעות קבוצת ההגדרות שיצרתם למתייגים. למשתמשים שמוסיפים תוויות צריכה להיות הרשאה מסוג אפשרות להחיל תוויות ולהגדיר עבורן ערכים. פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.

האם אפשר להשתמש בתווית הסיווג כתווית אימון?

לא, תווית הסיווג ותווית האימון חייבות להיות שונות. התווית שבחרתם כתווית סיווג לא זמינה כתווית אימון.

מערכי נתונים לאימון

אילו קבצים מתאימים לאימון המודל?

כדי לקבל את התוצאות הטובות ביותר באימון המודל, חשוב שהאנשים בארגון שיכולים להוסיף תוויות יפעלו לפי ההנחיות הבאות:

  • ודאו שכל קובץ מכיל לפחות 500 תווים.
  • בוחרים קבצים שמייצגים תוכן שהמשתמשים יוצרים, משתפים ומשתמשים בו בארגון.
  • מומלץ להוסיף תווית למספר דומה של קבצים לכל אפשרות של תווית, עם מינימום של 100 קבצים לכל אפשרות. כך המודל יכול להבין את הנתונים בצורה מקיפה ולשפר את הציונים.
  • צריך לכלול מגוון מייצג של קבצים לכל סוג אפשרות. לדוגמה, אל תסווגו 100 קורות חיים כקבוצת הדוגמאות שלכם לקבצים מסוג סודי ביותר, אם חוזים הם גם סוג נפוץ של קבצים מסוג סודי ביותר בארגון שלכם.
  • החלת התווית של ההדרכה רק על קבצים שנמצאים בבעלות הארגון, כלומר קבצים שנמצאים בבעלות ישירה של משתמשים או קבצים שמאוחסנים בתיקיות אחסון שיתופי. סיווג מבוסס-AI לא מעבד קבצים שנמצאים בבעלות של משתמשים חיצוניים או קבצים שנמצאים באחסון שיתופי חיצוני.

האם אפשר לאמן את המודל על קבצים שכבר סומנו?

בשלב הזה, אי אפשר לאמן את המודל על קבצים שסומנו בעבר. כדי שהמודל יוכל להחיל תווית על קבצים באופן אוטומטי, צריך להגדיר תווית אימון שהיא העתק של התווית הזו, אבל אי אפשר להשתמש באותה תווית.

האם אפשר לאמן את המודל בכמה שפות?

המודל תומך בכמה שפות, אבל צריך לכלול בנתוני האימון מדגם מייצג של קבצים לכל סוג אפשרות ושפה. כך גדל מספר הקבצים שנדרשים כדי לאמן את המודל בהצלחה. יש תמיכה רק בשפות שמבוססות על תווי לטינית.

איך הציונים מחושבים במהלך ההדרכה?

במהלך האימון, מודל ה-AI משתמש ב-75% מנתוני הקלט כדי לאמן את עצמו איך לתייג קבצים, ושומר 25% מהנתונים כדי לבדוק מעת לעת את הביצועים שלו. במילים אחרות, לגבי 25% מהקבצים המתויגים, המודל מנתח את הקבצים האלה כאילו הוא לא יודע איזו תווית הוחלה. לאחר מכן, מודל ה-AI בוחר תווית משלו ומשווה את הבחירה הזו לתווית בפועל שהמתייג הייעודי הוסיף. הציונים מראים את החלק היחסי של הקבצים שהוזמנו מראש, שהמודל הקצה להם את התווית הנכונה.

אחרי שאני מאמן מודל, האם אפשר "להקפיא" אותו כדי להפסיק את האימון מחדש באופן אוטומטי?

מודלים של סיווג AI מתאמנים באמצעות קבצים ב-Drive. כשקבצים כאלה נמחקים (לרוב לפי לוחות זמנים לשמירת נתונים דרך Google Vault), צריך למחוק גם את המודל כדי לוודא שהתוכן של הקבצים לא יישמר בצורה כלשהי. מסיבה זו, אימון מחדש של המודל מתבצע בלולאה רציפה ואי אפשר להשהות אותו.

האם משתמשים יכולים לשנות או לתקן תוויות וערכים בשדות?

משתמשים עם הרשאה יכולים לעדכן תווית או ערך בשדה, אבל סיווג ה-AI לא משנה את מודל הסיווג על סמך השינוי הזה. אם שמתם לב שהמודל הוסיף תוויות וערכי שדות בצורה שגויה, אתם יכולים לבקש מהמתייגים הייעודיים להקצות לקבצים את תווית האימון הנכונה. לאחר מכן, סיווג ה-AI משלב את הנתונים האלה במחזור הבא של אימון עצמי של המודל.

הוספה אוטומטית

האם סיווג באמצעות AI יכול להעריך תמונות, סרטונים וקובצי אודיו?

סיווג באמצעות AI משתמש באותו עיבוד של טקסט שאפשר להוסיף לאינדקס כמו ב-DLP ב-Drive. כל קובץ שממנו Drive יכול לחלץ טקסט שניתן לאינדוקס יכול להיבדק לצורך סיווג באמצעות תוויות שמבוססות על AI. היא כוללת זיהוי תווים אופטי (OCR) לחילוץ טקסט מתמונות. עם זאת, סיווג באמצעות AI לא בודק קובצי וידאו או אודיו.

האם סיווג ה-AI פועל רק כדי להוסיף תוויות לתוכן רגיש?

התכונה 'סיווג קבצים בעזרת AI' מתמקדת בעיקר בתוכן רגיש, אבל אפשר לאמן כל תווית עם עד 4 אפשרויות לתיוג אוטומטי. תוויות סיווג משמשות גם לביקורת, לשיפור יכולת החיפוש ולניהול השמירה.

האם סיווג באמצעות AI פועל כשההצפנה מצד הלקוח (CSE) מופעלת?

מכיוון ש-Google לא יכולה לפענח קבצים שהוצפנו באמצעות CSE (רק מפתח ההצפנה הפרטי שלכם יכול), סיווג מבוסס-AI לא יכול להתאמן על קבצים שהוצפנו באמצעות CSE ולא יכול להחיל תוויות על הקבצים האלה באופן אוטומטי.

איך ומתי סיווג ה-AI משנה את התוויות שנוספו אוטומטית?

אחרי שמפעילים את ההחלה האוטומטית, סיווג ה-AI סורק ומסווג את כל הקבצים במצב מנוחה שמהם הוא יכול לחלץ מספיק טקסט. הקבצים האלה נסרקים לפחות פעם אחת.

סיווג הקבצים בעזרת AI מעבד מחדש קבצים באופן תקופתי כשהתוכן משתנה. שינויים בתוכן יכולים להוביל לחיזוי שונה של קובץ. אם סיווג ה-AI מזהה אפשרות ישנה ואפשרות חדשה לקובץ, הוא יבחר באפשרות שמופיעה גבוה יותר ברשימת האפשרויות. לדוגמה, אם בשדה יש שלוש אפשרויות שמופיעות במרכז ניהול התוויות:

  • סודי
  • פנימי
  • גלוי לכולם

נניח שסיווג ה-AI מסווג קובץ כפנימי, והתוכן משתנה כך שמודל סיווג ה-AI חוזה סודי. במקרה הזה, הסיווג של הקובץ ישתנה לסודי. עם זאת, אם המודל לסיווג קבצים בעזרת AI חוזה שהסיווג הוא ציבורי, הסיווג של הקובץ יישאר פנימי.

סיווג באמצעות AI לא משנה תוויות שהוחלו אוטומטית וערכים בשדות שנבדקו או שונו על ידי משתמשים.

אם המודל משתנה, האם המודל מעריך מחדש קבצים קיימים באופן אוטומטי?

הקבצים שלכם מעובדים על ידי המודל העדכני ביותר כשהם נוצרים או משתנים. כשמתפרסמת גרסה חדשה של מודל, קבצים קיימים לא עוברים עיבוד מחדש באופן אוטומטי. עם זאת, יכול להיות שהמודל יעבד מחדש את כל הקבצים שלכם מעת לעת עם הגרסה העדכנית, ללא קשר לעדכונים ספציפיים של המודל או לאימון מחדש.

האם סיווג בעזרת AI מקבל עדיפות על פני שיטות סיווג אחרות כשכמה שיטות פעילות?

אפשר לבטל את סיווג הנתונים. סיווג הנתונים מתבצע לפי הסדר הבא:
  1. כלל DLP ללא החלפה של משתמש
  2. סיווג ידני
  3. כלל DLP עם הרשאת משתמש לעקוף את הכלל
  4. סיווג קבצים בעזרת AI
  5. סיווג ברירת המחדל
הסרה של תווית או שדה מאפשרת למנגנון סיווג ברמה נמוכה יותר לפעול. לדוגמה, אם משתמש מסיר תווית מקובץ, יכול להיות שסיווג קבצים בעזרת AI יוסיף את אותה תווית לקובץ בהמשך.

לאילו סוגים של קבצים אפשר להוסיף תוויות סיווג באמצעות AI?

  • סיווג באמצעות AI משתמש באותו עיבוד של טקסט שאפשר להוסיף לאינדקס כמו ב-DLP ב-Drive. פרטים נוספים מופיעים ברשימת סוגי הקבצים שנסרקים על ידי DLP. אין תמיכה בקובצי אודיו ווידאו.
  • כדי שסיווג ה-AI יוסיף תווית לקובץ, הוא צריך להכיל כמות מינימלית של טקסט. כתוצאה מכך, יכול להיות שקבצים מסוימים, כמו מסמכים קצרים מאוד ותמונות עם כמויות קטנות של טקסט, לא יסווגו.

מה קורה כשמשביתים אפשרות להחלה אוטומטית?

במהלך הסריקה, אם יש תחזית שלפיה לקובץ יש אפשרות שההוספה האוטומטית שלה מושבתת, סיווג ה-AI לא מוסיף לקובץ תוויות או ערכים של שדות.

קבצים שסיווג ה-AI הוסיף להם תוויות בעבר ישמרו את התווית ואת ערכי האפשרויות גם אחרי שהאפשרות מושבתת.

האם אפשר לבטל את ההחלה האוטומטית של תוויות?

אי אפשר לבטל את החלת התוויות. מומלץ לחדד ולבדוק את המודלים עם קהל קטן לפני שמבצעים פריסה רחבה. לדוגמה, אתם יכולים לאמן את המודלים באמצעות תווית זמנית. אחרי שהביצועים של המודל יהיו משביעי רצון, תוכלו 'לאפס' את המודל על ידי מחיקתו ויצירת מודל חדש עם אותה תווית אימון (אותו אוסף נתוני אימון), אבל עם התווית הקבועה שלכם.

רישוי

איך התכונה פועלת אצל משתמשים שאין להם רישיון מתאים?

אם לאדמין בארגון שלכם יש רישיון שתומך בסיווג באמצעות AI, הוא יכול לאמן מודל. למתייגים ייעודיים (המשתמשים שמחילים את תווית האימון) לא נדרש רישיון עם סיווג AI.

הבעלות על קבצים עם תווית אימון יכולה להיות של כל משתמש שיש לו רישיון שתומך בתוויות סיווג ב-Drive. עם זאת, סיווג קבצים בעזרת AI מוסיף תוויות רק לקבצים שנמצאים בתיקיות אחסון שיתופי או בבעלות של משתמשים שיש להם רישיונות שתומכים בסיווג קבצים בעזרת AI. קבצים שנמצאים בבעלות משתמשים שאין להם רישיון נתמך לא יעברו עיבוד על ידי סיווג באמצעות AI.

אם לאף משתמש אין רישיון שתומך בסיווג באמצעות AI, ההחלה האוטומטית מושבתת ומודל הסיווג נמחק. עם זאת, תוויות אימון ותוויות שמוחלות על ידי סיווג באמצעות AI נשארות בקבצים.

איך התכונה פועלת עבור משתמשים שהועברו לארכיון?

הקבצים של משתמשים עם רישיון ל-Google Workspace Enterprise Plus – Archived User יסומנו באמצעות סיווג מבוסס-AI.

איך מתחילים לעבוד כאדמינים של תוויות ב-Drive