For Gaza - من أجل غزة

html2rss [alpha] HTML to RSS customizable Converter - محول

html2rss [alpha] HTML to RSS customizable Converter - محول

New postby tGDA on 11 Sep 2008 23:18

كما يقول الإسم، html2rss خدمة تساعدك على تحويل صفحات الـHTML إلى خلاصات RSS،
محول html2rss، حول صفحات الـHTML إلى خلاصات RSS

حدد عنوان الصفحة المصدر.
ضع عنواناً ووصفاً للـRSS التي سيتم إنشائها.
حدد المجال الذي سيتم البحث عن العناصر ضمنه.
حدد من أين إلى أين سيتم إقتطاع العناصر.

حدد كيف سيتم إيجاد العنوان والرابط ضمن تلك القطعة، وكل شيء أصبح جاهزاً!

هناك بعض التعليمات في صفحة التحرير، ربما ليست كافية، سأترك المجال لكم للتجريب وأضع مثالاً في وقت لاحق!
Error #0:
UnIdetified being - tGDA on /universe/milkyway/earth/ @#87187..639763684710
unKnown problem: ; a log has been written down rcvrd: !u4iLmxWZzlXbgAHblhGIvRHIl1GIwxWZoBCZvdUetBSZzFWZsBHIsQ3cvxEI60WSi
-
___
also on Image and Image Image : )
User avatar
tGDA
LastTown team
 
Points:
Posts: 915
Joined: 03 Feb 2006 19:48

مثال عن إنشاء html2rss

New postby tGDA on 12 Sep 2008 14:23

مثال: نريد أن نسحب قائمة المواضيع من هذا المنتدى (منتدى "Town Achievements") ونحولها إلى خلاصة RSS:

  • أول ماعلينا معرفته هو عنوان هذه الصفحة، ألا وهو http://www.lastown.com/forum/viewforum.php?f=27
    إذاً فإننا سنضع العنوان هذا في الحقل HTML Provider Link:
    HTML Provider Link: http://www.lastown.com/forum/viewforum.php?f=27
  • ثانياً نضع عنواناً وتوصيفاً.. ضع ما شئت هنا:
    Feed Title: LasTown Town Achievements Forum
    Feed Description: hi there!
  • ثالثاً علينا تحديد من أين إلى أين في الصفحة يجب البحث عن عناصر الـRSS، هنا نحتاج إلى بعض المعرفة البسيطة في الـHTML، يجب عليك أن تضع حدوداً للمجال الذي سيتم البحث فيه، بشكل عام وللبحث في الصفحة بأكملها يمكنك تحديد <body كبداية و </body> كنهاية للبحث، ولكن للتحديد أكثر، إذا بحثنا في الشيفرة المصدرية لصفحة المنتدى، فإننا سنجد أن قائمة المواضيع محصورة بين <div class="topic-actions" > و <fieldset class="jumpbox">، لذا سنبحث بين هاتين فقط:
    HTML Content matching Start: <div class="topic-actions" >
    HTML Content matching End: <fieldset class="jumpbox">
  • الخطوة الرابعة هي تحديد الحدود التي تغلف كل العناصر التي نبحث عنها، مثلاً في بعض المواقع يتم عرض قائمة المواضيع في جدول، لذا فإن البداية تكون <tr والنهاية هي </tr> ولكن في صفحتنا فإذا نظرنا في كود الـHTML نجد أن كل موضوع يبدأ بـ<li class="row bg وينتهي بـ</dd> </dl> </li>
    HTML Row matching Start: <li class="row bg
    HTML Row matching End: </dd> </dl> </li>

إلى الآن قطعنا نصف الطريق، أصبح المحول يعرف أين يبحث وماهي حدود كل عنصر، بقي أن نحدد كيفية الحصول على عنوان عنصر الـRSS والرابط الخاص به من كل سجل تم العثور عليه في الصفحة، أولاً نضيف تفصيلين جديدين عن طريق الحقل Add New Details، حيث سنستعملهما للحصول على العنوان TITLE والرابط LINK من الصفحة.
  • نبحث في كود الـHTML عن الذي يحدد عنوان كل عنصر من العناصر (المواضيع في مثالنا هذا)، نجد أن هذه العنواين تتواجد كما يلي:

    Code: Select all
    <a href="./viewtopic.php?f=27&amp;t=885&amp;sid=0123456789abcdef0123456789abcdef" class="topictitle">LasTown Yahoo! Video Downloader!!</a>

    أي أن العنوان محصور بين البداية
    Code: Select all
    <a href="./viewtopic.php?f=27&amp;t=885&amp;sid=0123456789abcdef0123456789abcdef" class="topictitle">

    والنهاية
    Code: Select all
    </a>

    ولكن كما نلاحظ بأن النهاية بسيطة ولاتتغير من موضوع إلا أنه في البداية هناك بعض الأشياء اللتي ستتغير من موضوع إلى آخر، مثل الرقم الذي بعد t=، لذا يجب تحديد صيغة أعم لذلك، هناك بعض الصيغ العامة التي يمكن إستعمالها في هذه الحالات، مذكورة تحت بند Special Pattern Markup في التعليمات الموجودة أسفل صفحة التحرير، الصيغة التي سنستعملها هنا هي {NUM:0}، والتي تعني أنه مكانها يمكن ورود أي رقم بأي طول:
    البداية بعد تعميم رقم الموضوع:
    Code: Select all
    <a href="./viewtopic.php?f=27&amp;t={NUM:0}&amp;sid=0123456789abcdef0123456789abcdef" class="topictitle">

    هنا يجب أن تعرف كذلك أن الشريط المحرفي الست عشري الذي طوله 32 محرف هو متغير كذلك، لذا سنستعمل الصيغة {HEX:32} والتي تعني شريط محرفي ست عشري بطول 32 محرف.
    البداية بعد تعميم رقم الـsid:
    Code: Select all
    <a href="./viewtopic.php?f=27&amp;t={NUM:0}&amp;sid={HEX:32}" class="topictitle">

    أي أن الذي خلصنا إليه في النهاية بالنسبة لتفصيل الـTITLE هو التالي:
    Detail Name: TITLE
    Detail Starts with: <a href="./viewtopic.php?f=27&amp;t={NUM:0}&amp;sid={HEX:32}" class="topictitle">
    Detail Ends with: </a>

    اترك الحقلين الباقيين فارغين، لاحظ أنه يجب أن يكون الإسم TITLE، لاشيء آخر.
  • التفصيل الثاني الهام هو الرابط LINK، نعود إلى كود الـHTML، كذلك هنا تحتاج أن تعرف كيف تعمل الروابط في الانترنت، كي تتمكن من العثور على الرابط من الصفحة وإعادة كتابته بالشكل الكامل. ربما ليس هناك داع للعودة.. فكما تلاحظ من تفصيل الـTITLE ، فإن محدد البداية يحوي ضمنه عنوان الرابط الخاص بالموضوع، لذلك سنستعمله للبحث عن الرابط.
    الذي يهمنا لإعادة بناء الرابط هو القسم t={NUM:0}، الذي سنستعمله لإعادة توليد الرابط، أي أن محدد البداية هو ما قبله:
    Code: Select all
    <a href="./viewtopic.php?f={NUM:0}&amp;

    ومحدد النهاية هو مابعده:
    Code: Select all
    &amp;sid={HEX:32}" class="topictitle">

    هنا سنقوم بتحدد صيغة مابين البداية والنهاية، كوننا نعرفها:
    Code: Select all
    t={NUM:0}

    كذلك يجب أن نحدد كيفية إعادة كتابة الرابط، فالذي عثرنا عليه لايتجاوز t=885 أو t=929، ولكن ليس هذا الرابط بشكل كامل، بل يجب أن يكون العنوان مثل http://www.lastown.com/forum/viewtopic.php?t=885، لذا يجب أن نعيد كتابته ما يلي:
    Code: Select all
    http://www.lastown.com/forum/viewtopic.php?{FOUND}


    وهذا يعني أن الذي تم العثور عليه سيتم إستبداله بدل كلمة {FOUND} في العنوان السابق.
    ملخص الإدخالات لتفصيل الـLINK:

    Detail Name: LINK
    Detail Starts with: <a href="./viewtopic.php?f={NUM:0}&amp;
    Detail Middle Pattern: t={NUM:0}
    Detail Ends with: &amp;sid={HEX:32}" class="topictitle">
    Detail Output Format: http://www.lastown.com/forum/viewtopic.php?{FOUND}
هاقد انتهينا، الآن أصبح كل شيء جاهزاً، خذ الرابط وأصبح لديك خلاصة RSS للمنتدى.
Error #0:
UnIdetified being - tGDA on /universe/milkyway/earth/ @#87187..639763684710
unKnown problem: ; a log has been written down rcvrd: !u4iLmxWZzlXbgAHblhGIvRHIl1GIwxWZoBCZvdUetBSZzFWZsBHIsQ3cvxEI60WSi
-
___
also on Image and Image Image : )
User avatar
tGDA
LastTown team
 
Points:
Posts: 915
Joined: 03 Feb 2006 19:48

Re: html2rss [alpha] HTML to RSS customizable Converter - محول

New postby The Pirate on 09 Jan 2010 13:52

أنا عملت نفس مو مكتوب يعني مو متلو 100 % بس فيك تقول انو طبقت نفس المثال بس على غير مكان
القصة أنو طلعلي أرقام للأخطاء مثلا
Error #1 or Error #3
ف هدول فيك تخليون يدلونا وين الخطأ يعني الواحد يصير يعرف وين الخطأ مو بس يعرف أنو في خطأ
وجزاك الله خيرا :mrgreen:
There Is always space for free thoughts......

الله الوطن الإنسان

My Post's
Image
User avatar
The Pirate
LastTown team
 
Points:
Posts: 228
Joined: 03 Feb 2006 20:55
Location: damas

Re: html2rss [alpha] HTML to RSS customizable Converter - محول

New postby tGDA on 09 Jan 2010 14:08

أ
The Pirate wrote:وجزاك الله خيرا :mrgreen:


المشكلة أنك كمشتني من الإيد اللي بتوجعني :P

The Pirate wrote:نا عملت نفس مو مكتوب يعني مو متلو 100 % بس فيك تقول انو طبقت نفس المثال بس على غير مكان
القصة أنو طلعلي أرقام للأخطاء مثلا
Error #1 or Error #3
ف هدول فيك تخليون يدلونا وين الخطأ يعني الواحد يصير يعرف وين الخطأ مو بس يعرف أنو في خطأ

html2rss Error Codes:
Code: Select all
   const ERR_MORE_THAN_CONTENT_MATCHED=1;
   const ERR_ESSENTIAL_DETAILS_NOT_SUPPLIED=2;
   const ERR_INVALID_URL=3;
   const ERR_INCOMPLETE_BASE=4;

الخطأ رقم 1 يعني أنو المحددات اللي حددتلو ياها ليدور جواها عالكونتنت جابتلو أكتر من كونتنت من الصفحة، لازم تدور على شي أعم وفريد أكتر :)
Error #0:
UnIdetified being - tGDA on /universe/milkyway/earth/ @#87187..639763684710
unKnown problem: ; a log has been written down rcvrd: !u4iLmxWZzlXbgAHblhGIvRHIl1GIwxWZoBCZvdUetBSZzFWZsBHIsQ3cvxEI60WSi
-
___
also on Image and Image Image : )
User avatar
tGDA
LastTown team
 
Points:
Posts: 915
Joined: 03 Feb 2006 19:48


Return to Town Achievements

Who is online

Users browsing this forum: No registered users and 1 guest

cron