ארכיון פוסטים שפורסמו בחודש מרץ 2007

Robots.txt

יום חמישי, 22 במרץ 2007

הקובץ Robots.txt דרוש לבוטים המעכבשים (מלשון 'עכביש') את האתר שלנו כדי לדעת מאיזה קבצים וספריות להתרחק ולא למפות. יש בוטים שללא קובץ ה- Robots.txt לא ימפתחו כלל את האתר. אחרים, כמו Google או yahoo, ימפתחו אותו גם ללא ה-Robots.txt , אך במקרה כזה הם לא יידעו מאיזה קבצים או ספריות להתעלם.

נביא כאן מבוא ליסודות Robots.txt . למידע נרחב יותר, מומלץ לבקר ב-robotstxt.org.

להלן מבנה של קובץ Robots.txt די סטנדרטי, אותו יש למקם בספריית השורש של הדומיין, שכן שם יצפו הבוטים למצוא אותו:

User-agent: *
Disallow: /cgi-bin/
Disallow: /images/
Disallow: /group/

User-agent: msnbot
Crawl-delay: 10

User-agent: Teoma
Crawl-delay: 10

User-agent: Slurp
Crawl-delay: 10

User-agent: aipbot
Disallow: /

User-agent: BecomeBot
Disallow: /

User-agent: psbot
Disallow: /

——–> End of robots.txt file

MSNbot הוא, כפי שניתן לנחש, הבוט של MSN
Teoma הוא זה של Ask ו-Slurp הוא זה של yahoo.
כשאנו אומרים לבוטים "Disallow: /" אנו מורים להם שלא להיכנס לספריות ספציפיות או בכלל לאתר.
הנחיית "Crawl-delay: 10" מיועדת לבוטים שמעכבשים באתר במהירות רבה מדי ומשתמשים ביותר מדי משאבי מערכת, כשהם מטפלים בחמישה עד שבעה דפים בשנייה. הבוט של Google פועל לאט יותר מאחרים ולא זקוק להנחיה הזאת. הנחיה זו הכרחית בעיקר באתרים גדולים עם אלפי דפים. המספר 10 משמעותו הפוגה של עשר שניות בין טיפול בדף אחד למשנהו.

קובץ ה-Robots.txt חשוב לאבטחת האתר, כדי שמנועי החיפוש יתרחקו מאותם איזורים בהיררכיית האתר שלא היינו רוצים שאפשר יהיה לאתר אותם במנועי החיפוש. הבוטים של מנועי החיפוש (ובמיוחד של שלושת הגדולים – Google, Yahoo ו-MSN) מעוניינים שנכוון אותם וניתן להם את ההנחיות המתאימות לנו. כלי זה, Robots.txt , מאפשר לנו לעשות בדיוק את זה.

מסר לזבלנים

יום שישי, 09 במרץ 2007

הרשות האמריקנית לניירות ערך השעתה את המסחר במניותיהן של 35 חברות שמניותיהן קודמו בקמפיינים חוזרים ונישנים של דואר זבל. הוחלט על ההשעיה בשל חוסר הדיוק בפרטים שהובאו בהודעות הספאם. השעיית המסחר היא חלק ממבצע של רשות ניירות הערך האמריקנית, המכונה "Operation Spamalot", שנועד להגן על משקיעים מהודעות זבל שקריות המהללות מניות של חברות קטנות ומשתמשות בביטויים כמו "מניה לוהטת שעומדת לזנק" ו"כסף קל ומהיר". מעריכים שמאה מיליון הודעות ספאם כאלה נשלחות מדי שבוע, ומביאות לתנודות חדות במחיר המניות ובנפח המסחר, לפני שמשקיעים מאבדים את כספם.

"זה מעצבן כשדואר זבל סותם לנו את תיבות הדואר. אבל כשהוא גם מרמה את המשקיעים, זה לא חוקי ויש לכך תוצאות הרסניות", אומר יושב ראש רשות ניירות הערך האמריקנית כריסטופר קוקס. "השעיית המסחר עליה החלטנו היום, והצעדים בהם ננקוט בהמשך, אמורים להעביר מסר ברור לזבלנים: הרשות רואה אתכם אחראיים לעניין".

כך למשל, קמפיין ספאם שנועד לקדם את המניה של Healtheuniverse, בו נטען שהחברה מתכוונת להיות הראשונה שתמסחר שימוש בתאי גזע בשוק הניתוחים הפלסטיים והקוסמטיים שהיקפו 15 מיליארד דולר. ב-7 בספטמבר מניית החברה נסחרה במחיר של 12 סנט למניה ובהיקף מסחר ל 3,000 מניות. בעקבות הודעות הספאם זינקה מניית החברה למחיר של 22 סנט ב-11 בספטמבר, עם היקף מסחר של 2.2 מיליון מניות. ב-22 בספטמבר, מחיר המניה צנח שוב ל-11 סנט.

הפוסט הזה מסתמך על הודעה לעיתונות, שפירסמה הרשות האמריקנית לניירות ערך.

תרגום באינטרנט

יום שישי, 02 במרץ 2007

מערכת התרגום הרב-לשונית של Google, הידועה בשם Google Translate, מאפשרת, בדומה למערכת Babelfish, תרגום של קטעי מילוליים או של אתרי אינטרנט שלמים.
Google Translate מתרגמת באופן דו-כיווני בין אנגלית לספרדית, בין אנגלית לצרפתית, בין אנגלית לגרמנית, בין אנגלית לאיטלקית, בין אנגלית לפורטוגזית, בין אנגלית לרוסית, בין אנגלית לערבית, בין אנגלית לסינית, בין אנגלית ליפנית, בין אנגלית לקוריאנית, ובין צרפתית לגרמנית.
Babelfish, מציעה, בנוסף, גם תרגום דו-כיווני בין אנגלית להולנדית, אנגלית ליוונית, צרפתית להולנדית, צרפתית לספרדית, צרפתית לאיטלקית, צרפתית לגרמנית, וצרפתית ליוונית, והתרגום בין שתי שפות שאינן אנגלית הוא דבר ש-Google רק מתחילה בו, עם תרגום דו כיווני בין צרפתית לגרמנית ובין סינית (מפושטת) לסינית (מסורתית) בלבד בשלב זה

התרגום האוטומטי עם Google Translate איננו מושלם, כמובן, ועדיין לא ימנע לחם משולחנם של מתרגמים מקצועיים, אך בעלי אתר באנגלית יכולים, בהחלט, במינימום מאמץ, להוסיף, לאתרם תרגום מהיר on the fly לשפות זרות על מנת להגדיל את קהל היעד הפוטנציאלי של האתר.
הבעיה בתרגום לערבית עם Google Translate, כרגע, היא שכשמתרגמים אתר מאנגלית לערבית, המערכת הופכת את תצוגת האתר כך שהוא מופיע מימין לשמאל, מה שמחרבש את מבנה האתר לגמרי.
החבר'ה ב-Google מנסים לשפר את האופן בו Google Translate עובדת עבורנו. על פי הבלוג הרשמי של Google, תוצע בחלק מהתרגומים לשפות הביטא [אנגלית/ערבית, אנגלית/סינית, אנגלית/רוסית וסינית (מפושטת)/סינית (מסורתית)] אפשרות להציע לצוות הפיתוח תרגום משופר.