HebMorph–חיפוש מורפולוגי עברי. סיקור ושימוש ב-Production

22 בספטמבר 2011

ביום שלישי האחרון השתתפתי בערב מעניין (ישר כח למארגנים) שהיה במרכז המחקר והפיתוח של Microsoft בהרצליה. אחת ההרצאות שם הייתה על כלי מעניין בשם HebMorph, שהוא תוסף ל-Lucene/Lucene.net עבור חיפושים מורפולוגיים בעברית. לאחר ההרצאה שוחחתי קצרות עם איתמר, המרצה והמפתח, וסיפרתי לו שהכלי שלו נותן תוצאות מצויינות אבל הביצועים שלו בעייתיים. איתמר חייך, אמר לא יכול להיות ואולי טעינו בכמה דברים ונתן כמה רעיונות. אחר כך כבר נכנסנו למצגת הבאה ולזו שאחריה (זו על ה-nodejs) שזה תחום שמסקרן אותי – ולא מהיום. למחרת בבוקר התיישבתי במשרד והחלטתי לחקור את הנושא...
תגובה אחת

הלקוח מתלונן על איטיות בעדכון תכנים, "אצלי זה עובד". ובסוף הפיתרון

15 בספטמבר 2011

מעשה (אמיתי) שהיה לפני מס' חודשים: עוזי ברוך (מנהל מחלקת החדשות של ערוץ 7) מתקשר ומתלונן: העלתי מבזק, והוא לא פורסם בזמן. עוברים יומיים, ושוב אותה תלונה, ושוב ושוב ושוב מאנשי צוות שונים – חומרים עולים לאתר באיחור. את המבזק הבא אני מבקש להעלות בעצמי. מעמדת הפיתוח. מקבל את הטקסט ב-Messenger, מעתיק, ומדביק מול עיניהם. עובד. אבל החבר'ה בחדשות ממשיכים להתלונן. אני בינתיים נובר כמו משוגע בכל רכיבי המטמון במערכת ומוודא שהם נמחקים (flush) כשנצרך. שום דבר. עוברים חודשיים בהם אני סובל מטלפונים והודעות מתלוננות, עד שמצאתי את הבעיה האמיתית:...
תגיות: ,
אין תגובות

Cache עם Lock מבוסס memcached

28 במאי 2011

בעבר כתבתי על הבעיה הלא מאוד לא נפוצה שנגרמת כאשר משום מה מתבצעת פעולת Flush לחלקים גדולים של ה-Cache. מערכת שביום יום מתמודדת בהצלחה עם העומס ונותנת זמני תגובה מצויינים, מגמגמת ואף קורסת לדקות ארוכות בשעה שה-Cache עליו היא מתבססת או חלקים ממנו קרס. לפני קצת פחות משנתיים כתבתי על פתרון פשוט שמטרתו הייתה למנוע הרצת אותה פעולה מאות אלפי פעמים עד שנכנס ל-Cache אחד העותקים לשימוש בפעמים הבאות. הפיתרון עבד מאוד יפה כל עוד נמצאים באותו שרת, ובאותו Proccess של IIS. גם במקרים שלא, הפעולה צומצמה מאלפים של בקשות מקבילות לכמה עשרות, בתלות...
אין תגובות

דפדפן נייד ראשון שיתמוך ב-contentEditable: הוא Firefox Mobile

9 באפריל 2011

סוד גלוי הוא שהדפדפנים למכשירים ניידים (וזה כולל את Safari/Chrome למכשירי iOS ו-Android), את דפדפני Opera למינהם ולמיטב ידיעתי – גם IE9 הנייד. זו גם הסיבה לאכזבתו של אחד מכתבי ערוץ 7 שרכש לעצמו iPad כמיני נייד (חרף אזהרותיי, אגב – אני המלצתי על PC) וגילה לאכזבתו שבמכשיר המדליק עריכת כתבות עליו היא עניין לא נוח במיוחד וגם מוגבל. הערב נחשפתי במקרה ליציאתו לשוק של הדפדפן החדש של  Firefox לניידים, שמבוסס על Firefox 4. חיפוש קצר נוסף העלה כי הדפדפן לנייד אכן תומך ב-contentEditable, וממילא עורכי טקסט המבוססים עליו יעבדו. חידוש מרענן. הבלוג המקורי...
תגיות: , ,
אין תגובות

IE9: אין יותר זבל ב-User Agent. פרטיות וביצועים

21 במרץ 2011

גירסאות קודמות של IE איפשרו לתוכנות המותקנות במחשב (הנפוצות שבהן: .NET Framework, אבל גם אחרים) לשנות את ה-User Agent שנשלח לשרת. פרט לבעיית ביצועים זניחה (סתם עוד טקסט מיותר שנשלח עם כל בקשת HTTP), גילה כנראה מי שגילה את התכונה הזו כדרך "לבודד" משתמשים, לאור העובדה הפשוטה שכל מחשב הכיל User Agent מעט שונה. ישר כח ! Default User-Agent (UA) String Changed
אין תגובות

נתח שוק לדפדפנים בישראל – פורים תשע"א

17 במרץ 2011

מדי כמה חודשים אני מפרסם פה את נתח השוק של הדפדפנים בישראל, כפי שנאגרו על ידי אתר האינטרנט של ערוץ 7. למיטב ידיעתי – אין עוד אתר אינטרנט גדול (שאינו טכני) ישראלי שמפרסם את הפרטים האלה. הסטטיסטיקה של הנכנסים לבלוג הזה למשל, היא שונה בתכלית. נתח שוק של דפדפנים: נתח שוק של גירסאות IE:   נתח שוק של גירסאות Chrome: נתח שוק של גירסאות Firefox: כמו בפעמים שעברו, Firefox ו-Chrome מוחקים מהר מהר את הגירסאות הישנות, ובמהירות הן צוללות...
7 תגובות

IE9 RC1–התנסות ומסקנותיה

19 בפברואר 2011

אני חובב וותיק של Internet Explorer. כל הניסיונות השונים של חברים ומפתחים במהלך השנים לשכנע אותי לעבור לדפדפן אחר עלו בתוהו. בתור מפתח Web יצא לי לעבוד כמעט על כל דפדפן מאז IE4, כולל Netscape ז"ל (4 ו-6), Firefox עוד בתור Firebird, ועל לינוקס Konqueror וכשיצא ל-Windows גם Safari ובהמשך Chrome. לכל אחד היו היתרונות והחסרונות שלו בתהליך הפיתוח (למשל Firebug) אבל כדפדפן גלישה משום מה היה ונשאר שם Avant Browser, שהוא בעצם מעטפת יפה ומוצלחת ל-IE. מיד אחרי ששמעתי על יציאת גירסא RC1, מיהרתי להוריד ולהתקין אותה, ואלו הרשמים שלי: 1. חווייה - המערכת מהירה...
אין תגובות

MySQL: איטיות בפעולות LIMIT גדולות | Slow large Limit offsets

1 בפברואר 2011

(הפוסט רלוונטי במידה מסויימת גם ל-SQL Server) בעבר הדגמתי כיצד ניתן לבצע חלוקה לדפים ביעילות בMySQL וב-SQL Server, גם כשהטבלאות עליהן עובדים הולכות ומתנפחות. נתקלתי לא אחת במקרה בו הגולש (או המקרה הנפוץ יותר – מנוע חיפוש), מתחיל לרוץ על הדפים ומגיע לדף ה-1000 ויותר. במקרה כזה, מסד הנתונים צריך לעבור על כל הטבלה עד לשלב שאליו הוא הגיע. פעולה יקרה, איטית וזוללת משאבים תרשו לי להציע פיתרון אחר. ניקח לדוגמא את השליפה הזו: - Source Query – slow on large...
2 תגובות

MySQL 5.5.8 GA יצא. מה מעניין את משתמשי .net?

16 בדצמבר 2010

השבוע יצאה סוף סוף הגרסה הסופית של MySQL 5.5. אני מנחש שמשתמשי הלינוקס למיניהם ידושו בו ויחקרו אותו היטב, אבל חוץ מהם, מסתבר שהחבר'ה שם עשו עבודה טובה למדיי בכל מה שקשור למשתמשי מיקרוסופט. 1. ואת זה אני אומר מנסיון אישי, השיפור בביצועים בשליפות מתוחכמות מדהים! ואני מדבר בעיקר על המחשב השולחני שלי ולא על שרתי מפלצת. 2. השיפורים בביצועים על Windows מורגש היטב, לעיתים עד פי עשר משליפות קודמות. מישהו ב-Orcale לקח לראשונה ברצינות את מערכת ההפעלה הפופולרית ולא רק את Linux/Unix/Solaris. 3. MySQL הפכו את INNODB לברירת המחדל שלהם. בהתאמה, הוא גם מנצח את...
תגיות: , ,
אין תגובות