בפוסט הזה נמשיך לדבר על יישומים לצפייה ועריכה של מטא-נתונים בקבצי LibreOfficeכפי שהסברנו בעבר, למרות שניתן לעשות זאת עם יישומים בעלי ממשק גרפי, אנו בוחרים להשתמש בטרמינל כי ברגע שמתרגלים אליו, הוא מהיר יותר.
כפי שאמרנו במאמר הקודם, מטא-דאטה הוא פשוטו כמשמעו "נתונים על נתונים". במילים אחרות, זהו מידע תיאורי על תוכן של קובץ, מסד נתונים, תמונה או מסמך.
למה אנחנו צריכים מטא-דאטה?
מטא-דאטה היא הדרך היעילה ביותר לארגון כמויות גדולות של מידעזה משהו כמו כרטיסי האינדקס הישנים שבהם השתמשו בספריות, עם מידע על ספרים ומזהה שהקל על מציאתם על המדפים. בהמשך לדוגמת הספרייה, אם אתם מחפשים רצח באוריינט אקספרס כדאי לחפש בארון התיוק, אבל אם אתם רוצים רומן בלשי ולא יודעים איזה, פשוט גשו למדור הסיפורת ולמדף הבלשים ובחרו את זה שאתם הכי אוהבים.
באופן דומה, הודות למטא-דאטה ניתן לחפש באמצעות פרמטרים שונים כגון:
- פרמטרים המזהים ומתארים את המשאב: הם מספקים מידע על הכותרת, המחבר, מילות המפתח ופורמט הקובץ.
- פרמטרים מבניים: הם מספקים מידע על הקשר בין חלקים שונים של תוכן הספר.
- פרמטרים לשימור: הם מספקים מידע על מחברי המסמך המקורי, מחברי השינויים, הפורמט המקורי, הפורמטים שהומרו והתוכנה שבה נעשה שימוש.
בעוד שמטא-דאטה משרתת פונקציה שימושית מאוד הן בארגון והן באימות האותנטיות של קובץ, היא יכולה גם להיות סיוט של פרטיות, ולדלוף מידע סודי. זו הסיבה שאולי נרצה להסיר נתונים. ייתכן גם שמסיבות אדמיניסטרטיביות או משפטיות נצטרך להוסיף מידע נוסף.
יישומים לצפייה ועריכה של מטא-נתונים של LibreOffice באובונטו
ל-LibreOffice יש מטא-נתונים משותפים לכל המסמכים ומטא-נתונים ספציפיים לפורמטים מסוימים:
מטא-נתונים נפוצים כוללים:
- הכשרה.
- נושא.
- תיאור
- מילות מפתח.
- מְחַבֵּר.
- שפה.
- תאריך היווצרות.
- תאריך שינוי.
- זמן עריכה.
- מספר הפעמים שהמסמך נשמר.
- גרסת התוכנית בה נעשה שימוש.
LibreOffice משתמש במטא-דאטה הספציפיים הבאים:
- .odt: קבצי טקסט: מספר מילים ותווים, מספר עמודים, מספר טבלאות, מספר תמונות, אובייקטים מוטמעים.
- .ods: גיליון אלקטרוני: מספר גיליונות, מספר תאים עם תוכן, פקודות ומקרו, מספר אובייקטי OLE.
- .odp: מצגות: מספר שקופיות, מספר מילים בשקופיות, אובייקטי מולטימדיה ותמונות.
- .odg: ציור וקטורי: מספר אובייקטים ומידות בד הציור.
בכל המקרים, המטא-דאטה מאוחסן בקובץ בשם xml. מלבד פורמט odb, המשתמש במסד נתונים פנימי לאחסון מידע על הטבלאות, ניתן לערוך אותו ידנית בדרכים הבאות.
ישנן שתי דרכים להציג ולערוך מטא-דאטה של LibreOffice בטרמינל.
לפתוח וננו
כל פורמטי הקבצים המקוריים של LibreOffice הם קבצי zip. לכן, קל לערוך את הקבצים באופן ידני. השיטה היא כדלקמן:
unzip documento_de_prueba.odt -d metadatos
פקודה זו שומרת את תוכן הקובץ לתיקייה בשם metadata ויוצרת אותה אם היא אינה קיימת כבר. זכרו להחליף את test_document.odt בשם ובפורמט הקובץ של המסמך שלכם.
מה שמעניין אותנו הוא מסמך meta.xml. אנו פותחים אותו עם
cd metadatos כדי להיכנס לתיקייה שבה נשמר הקובץ הדחוס.
nano meta.xml
לאחר עריכת הקובץ, עלינו לבנות אותו מחדש, אך עם אמצעי זהירות אחד: לא ניתן לדחוס את קובץ ה-mimetype. לכן עלינו לבצע את השלבים הבאים.
cd metadatos אם היינו משאירים את התיקייה שבה נמצא המסמך הלא דחוס.
zip -0 ../nuevo_documento_de_prueba.odt סוג mime כדי להוסיף סוג mime לא דחוס לתיקייה הדחוסה.
zip -r ../nuevo_documento_de_prueba.odt * -x mimetype כדי להוסיף לכל שאר הקבצים הדחוסים
בדרך זו, LibreOffice ושאר התוכניות התואמות יזהו את הקובץ ללא בעיות.