چگونه می توان یک سایت بزرگ را خزید و داده ها را با استفاده از SEO Spider Screaming Frog استخراج کرد

فریاد قورباغه SEO عنکبوتی
زمان خواندن: 3 دقیقه

ما در حال حاضر به چندین مشتری کمک می کنیم مهاجرت های مارکتو. همانطور که شرکت های بزرگ از راه حل های سازمانی مانند این استفاده می کنند ، مانند یک تار عنکبوت است که خود را در طی سالها در فرایندها و سیستم عامل ها می بافد ... تا جایی که شرکت ها حتی از هر نقطه تماس آگاهی ندارند.

با یک پلت فرم اتوماسیون بازاریابی سازمانی مانند Marketo ، فرم ها نقطه ورود اطلاعات در سایت ها و صفحات اصلی هستند. شرکت ها اغلب هزاران صفحه و صدها فرم در سرتاسر سایتهای خود دارند که برای به روزرسانی باید شناسایی شوند.

یک ابزار عالی برای این کار است فریاد زدن عنکبوت SEO Frog... شاید محبوب ترین پلتفرم خزیدن ، حسابرسی و استخراج داده ها از یک سایت در بازار باشد. این پلتفرم دارای ویژگی های غنی است و صدها گزینه را برای تقریباً هر کاری که نیاز دارید ارائه می دهد.

Screaming Frog SEO Spider: Crawl and Extract

ویژگی اصلی Screaming Frog SEO Spider این است که می توانید استخراج های سفارشی را بر اساس آن انجام دهید Regex, XPath، یا CSSPath مشخصات این بسیار مفید است زیرا ما می خواهیم سایتهای مشتری را جستجو کنیم و مقادیر MunchkinID و FormId را از صفحات کنترل و ضبط کنیم.

با استفاده از ابزار ، باز کنید پیکربندی> سفارشی> استخراج برای شناسایی عناصری که می خواهید استخراج کنید.

استخراج سفارشی screamingfrog

صفحه استخراج امکان جمع آوری اطلاعات تقریباً نامحدود را فراهم می کند:

قوانین استخراج عنکبوت قورباغه SEO

استخراج Regex ، XPath و CSSPath

برای MunchkinID ، شناسه در اسکریپت فرم موجود در صفحه قرار دارد:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

سپس a را اعمال می کنیم قانون Regex برای گرفتن شناسه از درون برچسب اسکریپت وارد شده در صفحه:

Regex: ["']id["']: *["'](.*?)["']

برای شناسه فرم ، داده ها در یک برچسب ورودی در فرم Marketo هستند:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

ما اعمال می کنیم قانون XPath برای گرفتن شناسه از داخل فرم وارد شده در صفحه. پرس و جو XPath به دنبال فرم با ورودی با نام است ترسناک، سپس استخراج باعث صرفه جویی در می شود ارزش:

XPath: //form/input[@name="formid"]/@value

جیغ قورباغه SEO Spider Javascript رندر

یکی دیگر از گزینه های عالی Screaming Frog این است که شما به HTML موجود در صفحه محدود نمی شوید ، می توانید هر جاوا اسکریپتی را که قرار است فرم هایی در سایت شما قرار دهد ارائه دهید. در داخل پیکربندی> عنکبوت، می توانید به تب Rendering بروید و این را فعال کنید.

جیغ قورباغه SEO Spider Javascript رندر

البته خزیدن در سایت کمی بیشتر طول می کشد ، اما فرم هایی به دست می آیند که توسط JavaScript توسط مشتری ارائه می شوند و همچنین فرم هایی که از سمت سرور درج می شوند.

اگرچه این یک برنامه بسیار خاص است ، اما در حالی که با سایت های بزرگی کار می کنید بسیار کاربردی است. شما کاملاً می خواهید از جایی که فرم های شما در سراسر سایت جاسازی شده است ، حسابرسی کنید.

دانلود Screaming Frog SEO Spider

شما چه فکر میکنید؟

این سایت از Akismet برای کاهش هرزنامه استفاده می کند. بدانید که چگونه نظر شما پردازش می شود.