Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

הוספה אוטומטית של תוויות לקבצים ב-Google Drive באמצעות סיווג בעזרת AI

התכונה הזו כלולה במהדורות Frontline Plus ו-Enterprise Plus. היא כלולה גם בתוספים Gemini Enterprise–Legacy,‏ Gemini Education Premium ו-AI Security. השוואה בין תוספים

תוויות סיווג נתונים ב-Google Drive משמשות כמטא נתונים תיאוריים של קבצים, ואפשר להשתמש בהן למגוון פונקציות כמו הגנה על נתונים, חקירת ביקורת ושמירת נתונים. סיווג AI ב-Google Drive מאפשר להוסיף תוויות לקבצים באופן אוטומטי, בלי צורך בתכנות.

יש 2 שיטות לסיווג בעזרת AI:

מודלים בהתאמה אישית – יצירת מודל למידת מכונה ייחודי לארגון שלכם על סמך קבוצה של נתוני אימון ארגוניים. אדמינים יכולים לשלוט בנתונים שמשמשים לאימון המודלים. המודל ייחודי לארגון שלכם.
שימוש ב-Gemini (בטא): שימוש במודלים גדולים של שפה (LLM) של Gemini כדי לבדוק את תוכן הקובץ ולהחיל תוויות באופן אוטומטי על סמך הוראות מותאמות אישית בשפה פשוטה שאתם מגדירים. השיטה הזו לא דורשת איסוף נתונים או אימון מודלים מראש.

אתם יכולים ליצור עד 5 מודלים ייחודיים של סיווג מבוסס-AI או הוראות ל-Gemini בסך הכול, ויש לכם אפשרות לשלב בין שתי השיטות במסגרת המגבלה הכוללת הזו.

הערה: כדי שסיווג ה-AI יוסיף תוויות לקבצים, הם צריכים להיות בתיקיות אחסון שיתופי או בבעלות של משתמשים עם רישיונות שתומכים בתוויות סיווג.

שימוש בסיווג AI

אלה השלבים הבסיסיים להגדרת סיווג באמצעות AI כדי להוסיף תוויות באופן אוטומטי לקבצים חדשים וקיימים ב-Drive.

1. ליצור מודל בהתאמה אישית או הנחיות ל-Gemini: בוחרים או יוצרים תווית סיווג שרוצים להוסיף לקבצים באופן אוטומטי.

הערה: אם יוצרים מודל בהתאמה אישית, יוצרים גם את תווית האימון. התווית הזו משמשת לסימון קבצים לדוגמה שהמודל משתמש בהם כדי ללמוד איך לסווג נתונים.

2. (מודל בהתאמה אישית בלבד) אימון המודל: אחרי שיוצרים את התוויות, מתייגים ייעודיים מסווגים קבצים ב-Drive באמצעות תווית האימון כדי ליצור את מערך נתוני האימון. לאחר מכן המודל משתמש במערך הנתונים כדי ללמוד איך לסווג קבצים רגישים.

3. הפעלת סיווג באמצעות AI: אחרי שהמודל אומן או שהוגדרו הוראות ל-Gemini, אפשר להגדיר תיוג אוטומטי של קבצים, שנקרא הוספה אוטומטית. במהלך ההגדרה, בוחרים אילו אפשרויות של תוויות להפעיל ומי המשתמשים שבבעלותם הקבצים שרוצים שסיווג ה-AI יוסיף להם תוויות. לאחר מכן, המודל או ההוראות מתחילים לתייג קבצים רגישים.

4. מעקב אחרי המודל: אפשר להשתמש ביומן האירועים ב-Drive כדי לעקוב אחרי מספר הקבצים שסווגו, וגם אחרי מספר המשתמשים שאישרו או שינו תווית שהוחלה אוטומטית (אם יש להם הרשאות).

לפני שמתחילים

איך עובדות תוויות סיווג ואיך יוצרים אותן. פרטים נוספים זמינים במאמר התחלת העבודה כאדמינים של תוויות סיווג.
בחירת המתייגים הייעודיים – קבוצת משתמשים בארגון שיכולים להוסיף את תווית האימון באופן ידני לקבצים רגישים.
יוצרים קבוצת הגדרות רק עבור משתמשים שמוגדרים לסמן תוויות. הוראות מפורטות מופיעות במאמר התאמה אישית של הגדרות של שירות באמצעות הגדרות לקבוצות משתמשים.
מפעילים את ההרשאות הבאות בחשבון האדמין: ניהול תוויות סיווג, ניהול כללי DLP וצפייה בכללי DLP.

יצירת מודל

כדי ליצור מודל, קודם צריך לבחור תווית סיווג קיימת או ליצור תווית חדשה. לאחר מכן, צריך ליצור תווית אימון תואמת – באופן אוטומטי (מומלץ) או באופן ידני באמצעות המרכז לניהול תוויות – שבה ישתמשו המתייגים הייעודיים.

בחירה או יצירה של תווית סיווג

צריך להפעיל את הסיווג ב-Drive וב-Docs. אחרי האימון, מודל ה-AI מחיל באופן אוטומטי את תווית הסיווג על קבצים רגישים ב-Drive. המודל מאומן על שדה אחד בלבד לכל תווית, שחייב להיות רשימת תגים או רשימת אפשרויות.

מומלץ להשתמש בתווית רגישות עם תיוג, כי היא מוצגת בצורה בולטת במסמכים.

כשמשתמשים בשדה של רשימת אפשרויות או רשימת תגים לתווית סיווג, השדה צריך:

להכיל לפחות 2 אפשרויות ועד 7 אפשרויות
לפרסם

אם יש לכם תווית קיימת שעומדת בדרישות האלה, אתם יכולים להשתמש בה כתווית סיווג. אחרת, אפשר להשתמש במנהל התוויות כדי ליצור תווית, לפני או במהלך הגדרת המודל (בהמשך הדף). פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.

יצירת תווית אימון

תווית האימון כמעט זהה לתווית הסיווג, והיא משמשת רק למטרות אימון על ידי מתייגים ייעודיים. כשיוצרים את המודל (בהמשך הדף), אפשר ליצור אוטומטית את תווית האימון כדי לוודא שהיא תואמת לתווית הסיווג.

אפשר גם ליצור תווית אימון משלכם באופן ידני באמצעות המרכז לניהול תוויות, לפני שמגדירים את המודל או במהלך ההגדרה. פרטים נוספים מופיעים בהמשך הדף בקטע איך יוצרים ידנית תוויות לאימון?

יצירת המודל

במסוף Google Admin, נכנסים לתפריט אבטחה שליטה בגישה ובנתונים סיווג נתונים לקטגוריות.

מעבר לסיווג נתונים לקטגוריות

כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.
בקטע סיווג באמצעות AI, לוחצים על יצירת מודל.
ברשימה תווית סיווג, בוחרים תווית סיווג ושדה קיימים לאימון המודל, או לוחצים על יצירת תווית כדי ליצור תווית באמצעות מנהל התוויות.
אם יצרתם תווית במנהל התוויות, חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את התווית החדשה ברשימה.
כדי לבחור את תווית הסיווג, בוחרים את השדה המתאים שרוצים להשתמש בו ברשימה שם השדה.
לוחצים על המשך.
(אופציונלי) אפשר ליצור ולפרסם באופן אוטומטי תווית אימון שתואמת לתווית הסיווג:
1. לוחצים על יצירת תווית אימון.
2. בהודעה שמופיעה, לוחצים על עדכון הרשאות התווית. התווית נפתחת במצב עריכה במנהל התוויות בכרטיסייה נפרדת.
3. לוחצים על הרשאות עריכה, ואז מעניקים את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים לקבוצת ההגדרות שמכילה את המשתמשים שמתייגים את הקבצים.
4. לוחצים על שמירה וסוגרים את הכרטיסייה של מרכז ניהול התוויות.
  הערה: אפשר גם להגדיר הרשאות לתוויות מאוחר יותר. אבל חשוב שרק למתייגים תהיה גישה לתווית האימון.
(אופציונלי) אם כבר יצרתם תווית אימון, בוחרים אותה ברשימה תווית אימון.
(אופציונלי) כדי ליצור תווית אימון משלכם, לוחצים על מעבר למנהל התוויות.
חשוב: חשוב לוודא שהתווית עומדת בקריטריונים של תוויות אימון, ולהגדיר את הרשאות הגישה לתווית כך שרק המתייגים יוכלו לגשת אליה. פרטים נוספים מופיעים בהמשך הדף בקטע הנחיות לגבי תוויות הדרכה.

חוזרים לדף יצירת מודל. יכול להיות שתצטרכו לרענן את הדף כדי לראות את תווית האימון החדשה ברשימה.
בדף יצירת מודל, לוחצים על המשך.
מזינים שם תיאורי למודל.
לוחצים על יצירת מודל.

אחרי שיוצרים את המודל, בדף פרטי המודל מוצגות תווית האימון ותווית הסיווג שבחרתם.

אימון המודל

כדי לאמן את מודל ה-AI, צריך ליצור מערך נתונים לאימון ואז להתחיל את ריצת האימון הראשונית שלו. במהלך הרצת אימון, המודל לומד מהדוגמאות במערך הנתונים.

אימון מחדש אוטומטי: אחרי הרצת האימון הראשונית, המודל עובר אימון מחדש כל שבועיים כדי לשפר את רמת הדיוק שלו או לשמור עליה. בכל שלב אפשר לאמן את המודל מחדש ידנית. אחרי כל הרצת אימון מתפרסם מודל חדש, והתזמון האוטומטי של האימון מחדש מתאפס לעוד שבועיים.

יצירת קבוצת נתונים לאימון

כדי ליצור מערך נתונים לאימון, המתייגים הייעודיים צריכים להוסיף את תווית האימון לפחות ל-100 קבצים לכל תווית אפשרית. לדוגמה, אם לתווית יש 3 אפשרויות – נניח 'לשימוש פנימי בלבד', 'סודי' ו'ציבורי' – צריך לפחות 300 קובצי אימון. עם זאת, מומלץ להוסיף יותר מ-100 קבצים לכל תווית אפשרית, כי סביר להניח שחלק מהקבצים לא יעמדו בדרישות של מערך הנתונים לאימון. מידע נוסף על יצירת תוויות לדוגמאות אימון באיכות גבוהה

הערה: מערך הנתונים לאימון יכול לכלול עד מיליון קבצים.

אחרי שיוצרים את המודל, הוא בודק באופן אוטומטי תוך כ-24 שעות כמה קבצים סומנו לצורך אימון. לאחר מכן, המערכת בודקת באופן רציף לאורך כל היום.

כדי לבדוק כמה קבצים סומנו בתווית:

במסוף Google Admin, נכנסים לתפריט אבטחה שליטה בגישה ובנתונים סיווג נתונים לקטגוריות.

מעבר לסיווג נתונים לקטגוריות

כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.
בקטע סיווג באמצעות AI, לוחצים על הצגת מודלים שמורים.
בקטע פעולות של המודל, בוחרים באפשרות הצגת פרטים.
בחלונית שבראש הדף, בקטע קובצי אימון למודל פעיל, אפשר לראות את מספר הקבצים עם התוויות.

אם יש למודל מספיק קבצים לאימון, המצב יהיה 'מוכן לאימון'

הרצת אימון

בדרך כלל, הרצת אימון נמשכת 4 עד 6 שעות, אבל היא יכולה להימשך יותר זמן אם מדובר במערכי נתונים גדולים יותר. כדי שהמודל ילמד לתייג את הקבצים בצורה מדויקת, כנראה שיהיה צריך להריץ כמה תהליכי אימון.

במהלך הרצת אימון, המודל משווה את הסיווג שהוא בוחר לקובץ לתווית האימון שמוחלת על הקובץ כדי ליצור ציונים. פרטים נוספים זמינים במאמר איך מחושבים הציונים.

אחרי הרצת אימון, אפשר לבדוק את רמת הדיוק של המודל.

כדי להתחיל הרצת אימון:

במסוף Google Admin, נכנסים לתפריט אבטחה שליטה בגישה ובנתונים סיווג נתונים לקטגוריות.

מעבר לסיווג נתונים לקטגוריות

כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.
בקטע סיווג באמצעות AI, לוחצים על הצגת מודלים שמורים.
בדף פרטי המודל, בקטע פעולות של המודל, לוחצים על הצגת פרטים.
בחלונית ההדרכה בחלק העליון של הדף, לוחצים על התחלת הרצת אימון.
הערה: הכפתור הזה זמין רק אם המתייגים הוסיפו תוויות למספר המינימלי של קובצי אימון.

אחרי האימון: בדיקת ציוני המודל

אחרי הרצת אימון, המודל מתפרסם עם ציוני אחוזים לכל תווית אפשרית. כל ציון, שנקרא ציון היזכרות, הוא אחוז הדוגמאות לאימון שהמודל סיווג בצורה נכונה אחרי שהוא בדק את עצמו:

מתחת ל-50% – רמת דיוק נמוכה. המודל צריך נתונים טובים יותר והוא עדיין לא מוכן.
50% עד 80% – דיוק בינוני. יכול להיות שהמודל יהיה מוכן על בסיס מוגבל.
מעל 80% – רמת דיוק גבוהה. המודל מוכן לסיווג קבצים בארגון שלכם.

כדי לבדוק את רמת הדיוק של המודל אחרי הרצת אימון:

בדף פרטי המודל אפשר לראות את ציוני המודל:

בחלונית תוצאות האימון בחלק העליון של הדף, בקטע הקבצים והציונים הנוכחיים שנעשה בהם שימוש
בחלונית קבוצת הנתונים הנוכחית לאימון

יצירת הוראות ל-Gemini

כדי ליצור קבוצת הוראות ל-Gemini, צריך קודם לבחור תווית מוגדרת מראש שמכילה הוראות, או לבחור תווית סיווג קיימת. לפני שמתחילים, חשוב לוודא שהתווית הקיימת עומדת בקריטריונים הנדרשים להגדרה. פרטים נוספים זמינים במאמר בנושא בחירה או יצירה של תוויות סיווג בדף הזה.

כדי ליצור הוראות ל-Gemini:

במסוף Google Admin, נכנסים לתפריט אבטחה שליטה בגישה ובנתונים סיווג נתונים לקטגוריות.

מעבר לסיווג נתונים לקטגוריות

כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.
בקטע סיווג באמצעות AI, לוחצים על שימוש ב-Gemini.
בדף בחירת התווית ש-Gemini יוסיף, בוחרים באחת מהאפשרויות הבאות:
- בוחרים באפשרות החלת תווית מוגדרת מראש כדי להשתמש בתווית מוגדרת מראש עם הוראות תבנית שאפשר לערוך.
- בוחרים באפשרות הוספת תווית משלכם כדי להשתמש באחת מהתוויות הקיימות של הארגון.
אם אתם צריכים תווית חדשה, לוחצים על יצירת תווית כדי לפתוח את מנהל התוויות בכרטיסייה חדשה בדפדפן.
- הערה: אחרי יצירה ופרסום של תווית חדשה בכרטיסייה 'מנהל התוויות', צריך לחזור לכרטיסייה שימוש ב-Gemini להוספת תוויות ולרענן את הדף כדי לעדכן את האפשרויות הזמינות.
אם בוחרים באפשרות החלת תווית משלכם, בוחרים תווית מהתפריט הנפתח תווית סיווג.
לוחצים על התפריט הנפתח שם השדה ובוחרים שדה.
לוחצים על המשך.
בדף בדיקת פרטי ההוראות ל-Gemini, מזינים הוראות ברורות ומקיפות לכל אפשרות של תווית כדי לעזור ל-Gemini לסווג את הנתונים של הארגון. מוסיפים את הפרטים הבאים לכל אפשרות:
- מה האפשרות מייצגת, למשל קטגוריה, סוג או מאפיין
- איך Gemini צריך לזהות את האפשרות, למשל רמזים או מילות מפתח לחיפוש
- איך Gemini צריך לטפל בחריגים, כמו מצבים שבהם האפשרות לא צריכה לחול
לוחצים על המשך.
בדף בחירת אפשרויות התוויות שעומדות בדרישות להוספה אוטומטית, מסמנים את התיבות של אפשרויות התוויות הספציפיות ש-Gemini צריך להחיל באופן אוטומטי.
- הערה: Gemini לא יחיל על קבצים ב-Drive אפשרויות שלא סומנו.
לוחצים על המשך.
בדף בדיקה ומתן שם להוראות, מזינים שם תיאורי להוראות בשדה שם*. בודקים את הפרטים כדי לוודא שהם מדויקים.
לוחצים על שמירה או על שמירה והגדרה של ההוספה האוטומטית.

הפעלת סיווג AI

אחרי שמגדירים את ההוראות ל-Gemini או מאמנים את המודל המותאם אישית כדי להשיג רמת דיוק מינימלית (50% לפחות), אפשר לבחור אפשרויות של תוויות ולהפעיל תיוג אוטומטי של קבצים, או החלה אוטומטית. כדי להשיג את התוצאות הכי טובות עם מודל בהתאמה אישית, מומלץ לחכות עד שהציונים של המודל לכל האפשרויות של התוויות יגיעו ל-80% לפחות.

כדי להפעיל את היישום האוטומטי

במסוף Google Admin, נכנסים לתפריט אבטחה שליטה בגישה ובנתונים סיווג נתונים לקטגוריות.

מעבר לסיווג נתונים לקטגוריות

כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.
בקטע סיווג באמצעות AI, לוחצים על הצגת מודלים שמורים.
בדף פרטי המודל, בקטע פעולות של המודל, לוחצים על הצגת פרטים.
בחלונית ההדרכה, לוחצים על הגדרה של החלת המלצות באופן אוטומטי.
הערה: הלחצן הזה זמין רק אם לפחות אפשרות אחת של תווית הגיעה לדיוק של 50%.

לחלופין, אם כבר הגדרתם יישום אוטומטי, בקטע קבצים שמסומנים בתווית AI, לוחצים על עריכת היישום האוטומטי.
מסמנים את התיבות שלצד אפשרויות התוויות שרוצים לאפשר למודל ה-AI להחיל באופן אוטומטי.
כדי לבחור יחידות ארגוניות או קבוצות שהן הבעלים של הקבצים שהמודל צריך להחיל עליהם תוויות באופן אוטומטי, לוחצים על שמירה והמשך. הגדרת ברירת המחדל היא הארגון הראשי ברמה העליונה.
אפשר גם ללחוץ על שמירה כדי לבחור משתמשים מאוחר יותר.
אם בחרתם באפשרות 'בחירת משתמשים', בצד, בוחרים יחידה ארגונית או קבוצת משתמשים.
הגדרות של קבוצות מבטלות את ההגדרות של היחידות הארגוניות. מידע נוסף
לוחצים על מופעל – התווית מוחלת באופן אוטומטי עם אחת מהאפשרויות שלמטה.
לוחצים על שמירה.
בדף פרטי המודל, הסטטוס של החלה אוטומטית נוכחית של הכלל הוא מופעל.

הערה: אפשר לעקוב אחרי סיווג באמצעות AI באמצעות יומן האירועים של Drive. פרטים נוספים זמינים בקטע מעקב אחרי אירועים של תוויות סיווג מבוססות-AI בהמשך הדף.

כשסיווג ה-AI סורק קבצים

אחרי שמפעילים את היישום האוטומטי לקבצים בבעלות המשתמשים ולאחסון שיתופי, סיווג ה-AI סורק את הקבצים (במצב מנוחה) לפחות פעם אחת תוך שבוע עד שבועיים. סיווג באמצעות AI סורק גם קבצים בכל פעם שהם מועלים או משתנים, ויכול לשנות את התווית שהוחלה אם התוכן של הקובץ משתנה.

הערה: כשמשתמשים בסיווג AI עם הוראות ל-Gemini, צריך להפעיל סריקה של קבצים לא פעילים באופן ידני. כדי להפעיל את התכונה הזו, לוחצים על הוספת תוויות לקבצים לא פעילים בדף הוראות.

איך המערכת מטפלת בסתירות בין כללים שמוחלים באופן אוטומטי

כללי הגנה על נתונים

ערכי התוויות שמוגדרים על ידי כללים להגנה על נתונים מקבלים עדיפות על פני סיווג באמצעות AI, ושניהם מקבלים עדיפות על פני סיווג ברירת מחדל.

כמה מודלים בהתאמה אישית או הוראות ל-Gemini

אם שני מקורות סיווג AI או יותר מנסים להחיל על אותו קובץ אפשרויות שונות של אותו שדה תווית, האפשרות שמופיעה גבוה יותר ברשימת האפשרויות של התווית מוחלת. לדוגמה, יכול להיות שיש לכם תווית עם שדה שכולל 3 אפשרויות במרכז ניהול התוויות:

סודי
פנימי
גלוי לכולם

אם מקור סיווג מבוסס-AI אחד מנסה להגדיר את התווית כסודית, ומקור 2 מנסה להגדיר את התווית כציבורית לאותו קובץ, התווית סודית תוחל כי היא מופיעה גבוה יותר ברשימת האפשרויות של התווית. לפני שמגדירים כללים, חשוב לוודא שאפשרויות השדה של התווית מופיעות בסדר העדיפות המועדף.

תוויות שהמשתמשים מוסיפים

לתוויות שמשתמשים מחילים על קבצים יש עדיפות על פני תוויות שהוחלו על ידי AI – כלומר, סיווג באמצעות AI לא משנה תוויות שמשתמש הגדיר בעבר.

הערה: כשמשתמש מאשר או משנה קובץ עם תוויות שנוצרו על ידי AI, התווית נחשבת לתווית שהוחלה על ידי משתמש, וסיווג ה-AI לא ישנה יותר את הערך שלה.

מעקב אחרי המודל

איך מקבלים פרטים על האופן שבו סיווג באמצעות AI מתייג קבצים ביומן האירועים של Drive. לכל אפשרות של תווית, ביומן מוצג מספר הקבצים שסווגו באמצעות הוספה אוטומטית, ומספר המשתמשים שאישרו את התווית שהוחלה אוטומטית או שינו אותה. למשתמשים צריכות להיות הרשאות כדי לבצע פעולות בתוויות שמוחלות באופן אוטומטי.

ההרשאות שנדרשות למשתמשים כדי ליצור אינטראקציה עם תוויות שמוחלות באופן אוטומטי

כדי לבצע פעולות בתוויות שהמערכת החילה באופן אוטומטי, המשתמשים צריכים הרשאות לקובץ ולהרשאות לתווית. אפשר להגדיר הרשאות לתווית הסיווג במרכז ניהול התוויות. פרטים נוספים זמינים במאמר בנושא יצירת תוויות סיווג בארגון.

כדי לראות תוויות שנוספו אוטומטית, המשתמשים צריכים לקבל את ההרשאה אפשר לראות את התווית הזו לתווית הסיווג.
כדי לאשר ולשנות תוויות שנוספו באופן אוטומטי, המשתמשים צריכים את ההרשאה אפשרות להוסיף תוויות ולהגדיר בהן ערכים לתווית הסיווג, והם צריכים להיות בעלי הרשאת עריכה או בעלות על הקובץ.

הצגת אירועי סיווג באמצעות AI ביומן האירועים של Drive

במסוף Google Admin, נכנסים לתפריט אבטחה שליטה בגישה ובנתונים סיווג נתונים לקטגוריות.

מעבר לסיווג נתונים לקטגוריות

כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.
בקטע סיווג באמצעות AI, לוחצים על הצגת מודלים שמורים.
בדף פרטי המודל, בקטע קבצים עם תוויות AI, בוחרים באפשרות הצגת קבצים של אפשרות התווית שרוצים להציג את האירועים שלה.
הכלי לחקירת אבטחה נפתח בכרטיסייה חדשה, ומוצגות בו תוצאות חיפוש ביומן האירועים של Drive לגבי שני אירועים שקשורים לסיווג באמצעות AI: הוחלה תווית והערך של שדה התווית השתנה.
לוחצים על תיאור האירוע כדי לקבל פרטים נוספים, כמו:
- השם והסוג של המסמך שסומן
- הערך של שדה התווית שהוקצה למסמך (לדוגמה, סודי או מוגבל)

איך רואים את שיעור המשתמשים שאישרו את ההוראות ל-Gemini

בתרשים User acceptance בדף Model details של סיווג מבוסס-AI, מוצגים נתוני ביצועים של ההוראות שלכם, שנגזרים ממשוב משתמשים ב-180 הימים האחרונים.

המדדים כוללים:

המשתמש בדק – המספר הכולל של משתמשים שהייתה להם אינטראקציה עם באנר התווית האוטומטית, כדי לאשר או לשנות את אפשרות התווית שהוחלה באמצעות Gemini.
המשתמש אישר – המספר הכולל של משתמשים שבחרו להשאיר את התווית הספציפית שהוצעה על ידי Gemini.

ניהול המודל

השבתת ההחלה האוטומטית של תווית סיווג

כדי להשבית את ההחלה האוטומטית לכל האפשרויות של התוויות או רק לאפשרויות ספציפיות:

במסוף Google Admin, נכנסים לתפריט אבטחה שליטה בגישה ובנתונים סיווג נתונים לקטגוריות.

מעבר לסיווג נתונים לקטגוריות

כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.
בקטע סיווג באמצעות AI, לוחצים על הצגת מודלים שמורים.
בדף פרטי המודל, בקטע פעולות של המודל, לוחצים על הצגת פרטים.
בקטע קבצים עם תוויות שנוצרו על ידי AI, לוחצים על עריכת ההחלה האוטומטית.
מבטלים את הסימון בתיבות שלצד אפשרויות התוויות שרוצים להשבית את ההוספה האוטומטית שלהן.
כדי להשהות לחלוטין את ההוספה האוטומטית, צריך לבטל את הסימון בכל האפשרויות.

כדי להשבית לחלוטין את ההחלה האוטומטית ביחידות ארגוניות או בקבוצות ספציפיות:

אפשר להשבית לגמרי את היישום האוטומטי של תוויות לתוכן בבעלות משתמשים ביחידות ארגוניות או בקבוצות ספציפיות.

במסוף Google Admin, נכנסים לתפריט אבטחה שליטה בגישה ובנתונים סיווג נתונים לקטגוריות.

מעבר לסיווג נתונים לקטגוריות

כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.
בקטע סיווג באמצעות AI, לוחצים על הצגת מודלים שמורים.
בדף פרטי המודל, בקטע פעולות של המודל, לוחצים על הצגת פרטים.
בתפריט פעולות נוספות בראש הדף, לוחצים על ניהול של יישום אוטומטי עדכון של יחידות ארגוניות או קבוצות שמופעלות.
בצד ימין, לוחצים על יחידה ארגונית או קבוצה כדי לבחור אותה.
בוחרים באפשרות מושבת – התווית לא מוחלת באופן אוטומטי.
לוחצים על שמירה.

מחיקה של מודל בהתאמה אישית או הוראות ל-Gemini

יכול להיות שתצטרכו למחוק מודל בהתאמה אישית או הוראות ל-Gemini, למשל אם רמת הדיוק שלו לא מקובלת. אם מוחקים מודל בהתאמה אישית או הוראות ל-Gemini, כל הגדרות סיווג ה-AI שלו מוסרות באופן סופי. הערה:

התוויות שנעשה בהן שימוש במודל או בהוראות ל-Gemini יבוטלו מההגדרות של סיווג ה-AI, וההיסטוריה של המודל או ההוראות ל-Gemini תימחק. עם זאת, התוויות עצמן לא נמחקות ואפשר עדיין לנהל אותן במנהל התוויות.
(מודל בהתאמה אישית בלבד) תוויות האימון יישארו בקבצים. אחרי שמוחקים את המודל, אפשר להגדיר מודל חדש בהתאמה אישית כדי להשתמש באותה תווית אימון. אם משאירים את תווית האימון וקובצי האימון הקיימים, הביצועים של המודלים יהיו דומים.
החלת תוויות אוטומטית שהופעלה למודל הזה תופסק מיד. אתם יכולים לבחור להסיר או לשמור תוויות שהוחלו באופן אוטומטי בעבר על קבצים שלא אושרו או שונו על ידי משתמש.
אם תיצרו מחדש מודל חדש או הוראות ל-Gemini באמצעות אותה תווית סיווג, תכונת הסיווג באמצעות AI תחליף את התוצאות של סיווגים קודמים. האפשרות הזו מאפשרת לעבד מחדש את קובצי ה-Drive של הארגון. זה יכול להיות שימושי אם איכות המודל או ההוראות השתפרה באופן משמעותי מאז שהתחלתם להשתמש בהם.

כדי למחוק מודל או הוראות:

במסוף Google Admin, נכנסים לתפריט אבטחה שליטה בגישה ובנתונים סיווג נתונים לקטגוריות.

מעבר לסיווג נתונים לקטגוריות

כדי לעשות את זה צריך הרשאות אדמין לצפייה בכללי DLP וניהול כללי DLP.
בקטע סיווג באמצעות AI, לוחצים על הצגת מודלים שמורים.
בדף Model list (רשימת המודלים), לוחצים על Actions (פעולות) לצד המודל או ההוראות, בוחרים באפשרות Delete model (מחיקת המודל) או Delete instructions (מחיקת ההוראות). בתיבת הדו-שיח מפורטים ההשפעות של המחיקה, ואפשר להחליט אם לשמור או לבטל את התוויות שהוחלו בעבר:
- שמירת התוויות שהוחלו – תוויות שהוחלו בעבר על ידי גרסה כלשהי של ההוראות האלה יישארו בקבצים.
- הסרת תוויות שהוחלו – תוויות שהוחלו בעבר על ידי גרסה כלשהי של ההוראות האלה יוסרו מהקבצים. התוויות יוסרו תוך שבועיים. תוויות לא יוסרו אם הן שונו על ידי משתמש, כללים, מודל AI אחר או הוראות ל-Gemini.
מסמנים את התיבה כדי לאשר: המשך התהליך ייחשב כאישור שלך לכך שאי אפשר לבטל את הפעולה הזו.
כדי להמשיך, לוחצים על מחיקת המודל או על מחיקת ההוראות.

שאלות נפוצות

תוויות אימון וסיווג

מהן הדרישות לתוויות האימון והסיווג?

גם תווית הסיווג וגם תווית האימון צריכות לעמוד בקריטריונים הבאים:

צריך להוסיף לפחות 2 אפשרויות ולא יותר מ-7 אפשרויות.
האפשרויות שלהם צריכות להיות באותו סדר.
חובה לפרסם את האפליקציה.
להשתמש בתוויות עם הרשאות גישה שונות. תווית האימון צריכה להיות זמינה רק למתייגים ייעודיים שיכולים לאמן את המודל. יכול להיות שלתווית הסיווג תהיה גישה רחבה יותר.

איך יוצרים תווית אימון באופן ידני?

מומלץ ליצור את תווית האימון באופן אוטומטי כשמגדירים את המודל, אבל אפשר גם ליצור אותה באופן ידני במרכז ניהול התוויות. כדי לעשות את זה, צריך לפעול לפי ההנחיות הבאות:

מוודאים שהתווית עומדת בקריטריונים הנדרשים לתווית.
כדי שהמתייגים הייעודיים יוכלו לזהות את תווית האימון ולהחיל אותה בקלות כשיוצרים את מערך נתוני האימון, כדאי להוסיף לתווית את המילה train או training.
מוסיפים שדה תיאור לתווית ההדרכה כדי לעזור עוד יותר למתייגים המיועדים להבין את המטרה שלה.
חשוב להגדיר את הרשאות התווית לרק המתייגים הייעודיים שלכם – כלומר, אלה שיזהו קבצים לאימון המודל – באמצעות קבוצת ההגדרות שיצרתם למתייגים.

האם אפשר להשתמש בתווית הסיווג כתווית אימון?

לא, תווית הסיווג ותווית האימון חייבות להיות שונות. התווית שבחרתם כתווית סיווג לא זמינה כתווית אימון.

האם ההוראות ל-Gemini מאפשרות ל-Google להשתמש בנתונים הפרטיים שלי כדי לאמן מודלים גלובליים?

לא. כל הפעולות מתבצעות בגבולות בידוד מחמירים. התוכן הפנימי שלכם ב-Drive וההנחיות שקשורות אליו נשארים מבודדים בצורה מאובטחת בסביבת Workspace המורשית שלכם, ולא משמשים לאימון המודלים של Google. מידע נוסף על המחויבות שלנו לפרטיות ולאבטחה זמין במרכז המידע על פרטיות.

מערכי נתונים לאימון

אילו קבצים מתאימים לאימון המודל?

כדי לקבל את התוצאות הטובות ביותר באימון המודל, האנשים בארגון שיכולים להוסיף תוויות צריכים לפעול לפי ההנחיות הבאות:

חשוב לוודא שכל קובץ מכיל לפחות 500 תווים.
בוחרים קבצים שמייצגים תוכן שהמשתמשים יוצרים, משתפים ומשתמשים בו בארגון.
מומלץ להוסיף תווית למספר דומה של קבצים לכל אפשרות של תווית, עם מינימום של 100 קבצים לכל אפשרות. כך המודל יכול להבין את הנתונים בצורה מקיפה ולשפר את הציונים.
צריך לכלול מגוון מייצג של קבצים לכל סוג אפשרות. לדוגמה, אם חוזים הם גם סוג נפוץ של קובץ סודי ביותר בארגון, אל תסמנו 100 קורות חיים כקבוצה הכוללת של קבצים לדוגמה לסיווג סודי ביותר.
החלת התווית של ההדרכה רק על קבצים שנמצאים בבעלות הארגון, כלומר קבצים שנמצאים בבעלות ישירה של משתמשים או קבצים שמאוחסנים בתיקיות אחסון שיתופי. סיווג מבוסס-AI לא מעבד קבצים שנמצאים בבעלות של משתמשים חיצוניים או קבצים שנמצאים באחסון שיתופי חיצוני.

האם אפשר לאמן את המודל על קבצים שכבר תויגו?

בשלב הזה, אי אפשר לאמן את המודל על קבצים שסומנו בעבר. כדי שהמודל יוכל להחיל תווית באופן אוטומטי על קבצים, צריך להגדיר תווית אימון שהיא העתק של התווית הזו, אבל אי אפשר להשתמש באותה תווית.

האם אפשר לאמן את המודל בכמה שפות?

המודל תומך בכמה שפות, אבל צריך לכלול בנתוני האימון מדגם מייצג של קבצים לכל סוג אפשרות ושפה. הפעולה הזו מגדילה את מספר הקבצים שנדרשים כדי לאמן את המודל בהצלחה. יש תמיכה רק בשפות שמבוססות על תווי לטינית.

איך הציונים מחושבים במהלך ההדרכה?

במהלך האימון, מודל ה-AI משתמש ב-75% מנתוני הקלט כדי לאמן את עצמו איך לתייג קבצים, ושומר 25% מהנתונים כדי לבדוק את הביצועים שלו באופן תקופתי. במילים אחרות, לגבי 25% מהקבצים המתויגים, המודל מנתח את הקבצים האלה כאילו הוא לא יודע איזו תווית הוחלה עליהם. לאחר מכן, מודל ה-AI בוחר תווית משלו ומשווה את הבחירה הזו לתווית בפועל שהמתייג הייעודי הוסיף. הציונים מראים את החלק היחסי של הקבצים השמורים שהמודל הקצה להם את התווית הנכונה.

אחרי שאני מאמן מודל, האם אפשר "להקפיא" אותו כדי להפסיק את האימון מחדש באופן אוטומטי?

מודלים של סיווג AI מתאמנים באמצעות קבצים ב-Drive. כשקבצים כאלה נמחקים (לרוב לפי לוחות זמנים לשמירת נתונים דרך Google Vault), צריך למחוק גם את המודל כדי לוודא שהתוכן של הקבצים לא יישמר בצורה כלשהי. מסיבה זו, אימון מחדש של המודל מתבצע בלולאה רציפה ואי אפשר להשהות אותו.

האם משתמשים יכולים לשנות או לתקן תוויות וערכים בשדות?

משתמשים עם הרשאה יכולים לעדכן תווית או ערך בשדה, אבל סיווג ה-AI לא משנה את מודל הסיווג על סמך השינוי הזה. אם שמתם לב שהמודל הוסיף תוויות וערכי שדות בצורה שגויה, אתם יכולים לבקש מהמתייגים הייעודיים להקצות לקבצים את תווית האימון הנכונה. לאחר מכן, סיווג ה-AI משלב את הנתונים האלה במחזור הבא של אימון עצמי של המודל.

הוספה אוטומטית

האם סיווג באמצעות AI יכול להעריך תמונות, סרטונים וקובצי אודיו?

סיווג באמצעות AI משתמש באותו עיבוד טקסט שניתן לאינדוקס כמו ב-DLP ב-Drive. אפשר להעריך כל קובץ ש-Drive יכול לחלץ ממנו טקסט שניתן לאינדוקס, כדי להחיל עליו תוויות סיווג באמצעות AI. היא כוללת זיהוי תווים אופטי (OCR) לחילוץ טקסט מתמונות. עם זאת, סיווג ה-AI לא בודק קובצי וידאו או אודיו.

האם סיווג ה-AI פועל רק כדי להוסיף תוויות לתוכן רגיש?

התכונה 'סיווג קבצים בעזרת AI' מתמקדת בעיקר בתוכן רגיש, אבל אפשר לאמן כל תווית עם עד 4 אפשרויות לתיוג אוטומטי. תוויות סיווג משמשות גם לביקורת, לאיתור ולניהול שמירה.

האם סיווג באמצעות AI פועל כשההצפנה מצד הלקוח (CSE) מופעלת?

מכיוון ש-Google לא יכולה לפענח קבצים שהוצפנו באמצעות CSE (רק מפתח ההצפנה הפרטי שלכם יכול), סיווג מבוסס-AI לא יכול להתאמן על קבצים שהוצפנו באמצעות CSE ולא יכול להחיל תוויות על הקבצים האלה באופן אוטומטי.

איך ומתי סיווג ה-AI משנה את התוויות שנוספו אוטומטית?

אחרי שמפעילים את ההחלה האוטומטית, סיווג ה-AI סורק ומסווג את כל הקבצים במצב מנוחה שמהם הוא יכול לחלץ מספיק טקסט. הקבצים האלה נסרקים לפחות פעם אחת.

סיווג הקבצים בעזרת AI מעבד מחדש קבצים באופן תקופתי כשהתוכן משתנה. שינויים בתוכן עשויים להוביל לחיזוי שונה של קובץ. אם לסיווג ה-AI יש אפשרות ישנה ואפשרות חדשה לחיזוי לגבי קובץ, הוא יתעדף את האפשרות שנמצאת במיקום גבוה יותר ברשימת האפשרויות. לדוגמה, אם בשדה יש שלוש אפשרויות שמופיעות במרכז ניהול התוויות:

סודי
פנימי
גלוי לכולם

נניח שסיווג ה-AI מסווג קובץ כפנימי, והתוכן משתנה כך שמודל סיווג ה-AI חוזה סודי. במקרה הזה, הסיווג של הקובץ ישתנה לסודי. עם זאת, אם מודל סיווג ה-AI חוזה שהסיווג הוא ציבורי, הסיווג של הקובץ יישאר פנימי.

סיווג באמצעות AI לא משנה תוויות שהוחלו אוטומטית וערכים בשדות שנבדקו או שונו על ידי משתמשים.

אם המודל משתנה, האם המודל מעריך מחדש קבצים קיימים באופן אוטומטי?

הקבצים שלכם מעובדים על ידי המודל העדכני ביותר כשהם נוצרים או משתנים. כשמתפרסמת גרסה חדשה של מודל, קבצים קיימים לא עוברים עיבוד מחדש באופן אוטומטי. עם זאת, יכול להיות שהמודל יעבד מחדש את כל הקבצים שלכם מעת לעת עם הגרסה העדכנית, ללא קשר לעדכונים ספציפיים של המודל או לאימון מחדש.

האם סיווג בעזרת AI מקבל עדיפות על פני שיטות סיווג אחרות כשיש כמה שיטות פעילות?

אפשר לבטל את סיווג הנתונים. סיווג הנתונים מתבצע לפי הסדר הבא:

כלל DLP ללא החלפה של המשתמש
סיווג ידני
כלל DLP עם החלפה של משתמש
סיווג AI
סיווג ברירת המחדל

הסרה של תווית או שדה מאפשרת למנגנון סיווג ברמה נמוכה יותר לפעול. לדוגמה, אם משתמש מסיר תווית מקובץ, יכול להיות שסיווג קבצים בעזרת AI יוסיף את אותה תווית לקובץ מאוחר יותר.

לאילו סוגים של קבצים אפשר להוסיף תוויות סיווג באמצעות AI?

סיווג באמצעות AI משתמש באותו עיבוד טקסט שניתן לאינדוקס כמו ב-DLP ב-Drive. פרטים נוספים מופיעים ברשימת סוגי הקבצים שנסרקים על ידי DLP. אין תמיכה בקובצי אודיו ווידאו.
כדי שסיווג ה-AI יוסיף תווית לקובץ, הוא צריך להכיל כמות מינימלית של טקסט. כתוצאה מכך, יכול להיות שקבצים מסוימים, כמו מסמכים קצרים מאוד ותמונות עם כמויות קטנות של טקסט, לא יסווגו.

מה קורה כשמשביתים אפשרות להחלה אוטומטית?

במהלך הסריקה, אם המערכת מזהה בקובץ אפשרות שהיישום האוטומטי שלה מושבת, סיווג ה-AI לא מוסיף לקובץ תוויות או ערכי שדות.

קבצים שסיווג ה-AI הוסיף להם תוויות בעבר ישמרו את התווית ואת ערכי האפשרויות גם אחרי שהאפשרות מושבתת.

האם אפשר לבטל את ההחלה האוטומטית של תוויות?

אי אפשר לבטל את החלת התוויות. מומלץ לחדד ולבדוק את המודלים עם קהל קטן לפני שמבצעים פריסה רחבה. לדוגמה, אתם יכולים לאמן את המודלים עם תווית זמנית. לאחר מכן, כשהביצועים של המודל מספקים, אפשר 'לאפס' את המודל על ידי מחיקתו ויצירת מודל חדש עם אותה תווית אימון (אותו אוסף נתוני אימון), אבל עם התווית הקבועה.

‫Gemini ומודלים בהתאמה אישית

האם סיווג באמצעות AI עם הוראות ל-Gemini מחליף לחלוטין את המודלים הקיימים בהתאמה אישית?

לא. ההוראות ל-Gemini פועלות כחלופה משלימה. בזמן שמודלים קלאסיים יוצרים מודל מבודד שמותאם ללקוח באופן ספציפי על סמך דפוסי הנתונים ההיסטוריים שלו, ההוראות ל-Gemini משתמשות במודל הבסיס שאומן מראש כדי להעריך את התוכן בהתאם לכללים מותאמים אישית מבוססי-טקסט שאתם כותבים.

איך מחליטים מתי להשתמש בהוראות ל-Gemini או במודלים קלאסיים?

ארגונים לא חייבים לבחור ארכיטקטורה אחת בלבד. אפשר להשתמש בשני המצבים יחד כדי לתמוך בשלבים שונים של סיווג נתונים בהתאם לצרכים של הארגון.

אילו רכיבים כוללות הוראות לסיווג נתונים?

הוראת סיווג היא תוכנית מובנית שניתנת ל-Gemini. כדי לעזור ל-Gemini לסווג את הנתונים, צריך להזין פרטים ברורים ומקיפים של הוראות לכל אפשרות של תווית, כולל מה האפשרות מייצגת, איך Gemini צריך לזהות אותה ואיך לטפל בחריגים.

התנהגות של סיווג קבצים בעזרת AI ב-Gemini

למה Gemini מקצה מדי פעם אפשרויות שונות של תוויות לקבצים זהים או כמעט זהים?

מודלים של שפה גדולה הם הסתברותיים ולא דטרמיניסטיים. בעוד שקוד מסורתי פועל לפי לוגיקה קבועה כדי ליצור פלטים זהים לקלט נתון, מודלים מסוג LLM יוצרים תשובות על סמך הסתברויות סטטיסטיות. התהליך הזה מושפע מפרמטרים פנימיים כמו 'רמת אקראיות', שמוסיפים מידה מסוימת של שונות לבחירות של המודל. בנוסף, כמה משתנים חיצוניים יכולים לשנות את ההיגיון הפנימי של המודל ולהוביל לתוצאות שונות עבור קבצים זהים או כמעט זהים. הגורמים האלה כוללים עדכונים לגרסת המודל הבסיסית, שיפורים בהוראות ברמת המערכת או אפילו התאריך והשעה הספציפיים של בקשת הסיווג. כתוצאה מכך, הרכיבים הדינמיים האלה מבטיחים ש-Gemini יבדוק כל קובץ בחלון הקשר ייחודי, ולכן יכול להיות שמדי פעם יוקצו תוויות שונות.

הוספה אוטומטית של תוויות לקבצים ב-Google Drive באמצעות סיווג בעזרת AI קל לארגן דפים בעזרת אוספים אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.