چگونه می توان یک سایت بزرگ را خزید و داده ها را با استفاده از SEO Spider Screaming Frog استخراج کرد

فریاد قورباغه SEO عنکبوتی

ما در حال حاضر به چندین مشتری کمک می کنیم مهاجرت های مارکتو. همانطور که شرکت های بزرگ از راه حل های سازمانی مانند این استفاده می کنند ، مانند یک تار عنکبوت است که طی سالها خود را در فرآیندها و سیستم عامل ها می بافد ... تا جایی که شرکت ها حتی از هر نقطه تماس آگاهی ندارند.

با یک پلت فرم اتوماسیون بازاریابی سازمانی مانند Marketo ، فرم ها نقطه ورود اطلاعات در سایت ها و صفحات اصلی هستند. شرکت ها اغلب هزاران صفحه و صدها فرم در سرتاسر سایتهای خود دارند که برای به روزرسانی باید شناسایی شوند.

یک ابزار عالی برای این کار است SEO Spidering قورباغه SEO... شاید محبوب ترین پلتفرم خزیدن ، حسابرسی و استخراج داده ها از یک سایت در بازار باشد. این پلتفرم دارای ویژگی های غنی است و صدها گزینه را برای تقریباً هر کاری که نیاز دارید ارائه می دهد.

Screaming Frog SEO Spider: Crawl and Extract

ویژگی اصلی Screaming Frog SEO Spider این است که می توانید استخراج های سفارشی را بر اساس آن انجام دهید Regex, XPath، یا CSSPath مشخصات خاص این بسیار مفید است زیرا ما می خواهیم سایتهای مشتری را جستجو کنیم و مقادیر MunchkinID و FormId را از صفحات کنترل و ضبط کنیم.

با استفاده از ابزار ، باز کنید پیکربندی> سفارشی> استخراج برای شناسایی عناصری که می خواهید استخراج کنید.

استخراج سفارشی screamingfrog

صفحه استخراج امکان جمع آوری اطلاعات تقریباً نامحدود را فراهم می کند:

قوانین استخراج عنکبوت قورباغه SEO

استخراج Regex ، XPath و CSSPath

برای MunchkinID ، شناسه در اسکریپت فرم موجود در صفحه قرار دارد:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

سپس a را اعمال می کنیم قانون Regex برای گرفتن شناسه از درون برچسب اسکریپت وارد شده در صفحه:

Regex: ["']id["']: *["'](.*?)["']

برای شناسه فرم ، داده ها در یک برچسب ورودی در فرم Marketo هستند:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

ما اعمال می کنیم قانون XPath برای گرفتن شناسه از داخل فرم وارد شده در صفحه. پرس و جو XPath به دنبال فرم با ورودی با نام است ترسناک، سپس استخراج باعث صرفه جویی در می شود ارزش:

XPath: //form/input[@name="formid"]/@value

جیغ قورباغه SEO Spider Javascript رندر

یکی دیگر از گزینه های عالی Screaming Frog این است که به HTML موجود در صفحه محدود نمی شوید ، می توانید هر JavaScript که قرار است فرم هایی را در سایت شما قرار دهد ارائه دهید. در داخل پیکربندی> عنکبوت، می توانید به تب Rendering بروید و این را فعال کنید.

جیغ قورباغه SEO Spider Javascript رندر

البته خزیدن در سایت کمی بیشتر طول می کشد ، اما فرم هایی به دست می آیند که توسط JavaScript توسط مشتری ارائه می شوند و همچنین فرم هایی که از سمت سرور درج می شوند.

اگرچه این یک برنامه بسیار خاص است ، اما در حالی که با سایت های بزرگی کار می کنید فوق العاده کاربردی است. شما کاملاً می خواهید از جایی که فرم های شما در سراسر سایت جاسازی شده است ، حسابرسی کنید.

دانلود Screaming Frog SEO Spider

شما چه فکر میکنید؟

این سایت از Akismet برای کاهش هرزنامه استفاده می کند. بدانید که چگونه نظر شما پردازش می شود.