برخی از توابع کل می توانند نه تنها ستون های آرگومان (مورد استفاده برای فشرده سازی) ، بلکه مجموعه ای از پارامترها - ثابت برای اولیه سازی را بپذیرند. نحو دو جفت براکت به جای یک است. مورد اول برای پارامترها و دوم برای استدلال ها است.
بافت نگار
یک هیستوگرام تطبیقی را محاسبه می کند. این نتایج دقیق را تضمین نمی کند.
توابع از یک الگوریتم درخت تصمیم موازی جریان استفاده می کنند. مرزهای سطل های هیستوگرام با وارد کردن داده های جدید یک تابع تنظیم می شوند. در حالت مشترک ، عرض سطل ها برابر نیستند.
استدلال
مقادیر - بیان که منجر به مقادیر ورودی می شود.
مولفه های
Number_of_bins - حد بالایی برای تعداد سطل های موجود در هیستوگرام. این تابع به طور خودکار تعداد سطل ها را محاسبه می کند. سعی می کند به تعداد مشخصی از سطل های مشخص برسد ، اما در صورت عدم موفقیت ، از سطل های کمتری استفاده می کند.
مقادیر برگشتی
آرایه ای از قالب های زیر:
مثال
به عنوان مثال می توانید یک هیستوگرام را با عملکرد نوار تجسم کنید:
در این حالت ، باید به یاد داشته باشید که مرزهای سطل هیستوگرام را نمی شناسید.
Sequencematch (الگوی) (Timestamp ، Cond1 ، Cond2 ،…)
بررسی می کند که آیا دنباله شامل یک زنجیره رویداد است که با الگوی مطابقت دارد یا خیر.
رویدادهایی که در همان دوم اتفاق می افتد ممکن است در یک ترتیب نامشخص در نتیجه تأثیر بگذارد.
استدلال
Timestamp - ستون در نظر گرفته شده حاوی داده های زمانی است. انواع داده های معمولی تاریخ و dateTime هستند. همچنین می توانید از هر یک از انواع داده های UINT پشتیبانی شده استفاده کنید.
CONT1 ، CONT2 - شرایطی که زنجیره وقایع را توصیف می کند. نوع داده: uint8. می توانید تا 32 آرگومان شرایط را تصویب کنید. این عملکرد فقط وقایع شرح داده شده در این شرایط را در نظر می گیرد. اگر دنباله حاوی داده هایی باشد که در یک شرایط شرح داده نشده است ، عملکرد آنها را رد می کند.
مولفه های
- الگوی - رشته الگوی. الگوی نحو را ببینید.
مقادیر برگشتی
- 1 ، اگر این الگوی مطابقت داشته باشد.
- 0 ، اگر این الگوی مطابقت نداشته باشد.
(؟ n) - با استدلال شرط در موقعیت n مطابقت دارد. شرایط در محدوده [1 ، 32] شماره گذاری می شود. به عنوان مثال ، (1) با استدلال منتقل شده به پارامتر COND1 مطابقت دارد.
.* - با هر تعداد رویداد مطابقت دارد. برای مطابقت با این عنصر الگوی ، نیازی به استدلال مشروط ندارید.
(?t operator value) — Sets the time in seconds that should separate two events. For example, patte (?1)(?t>1800)(?2) matches events that occur more than 1800 seconds from each other. An arbitrary number of any events can lay between these events. You can use the>= ,> , <,
مثال ها
داده ها را در جدول T در نظر بگیرید:
پرس و جو را انجام دهید:
این تابع زنجیره رویداد را پیدا کرد که در آن شماره 2 شماره 1 را دنبال می کند. شماره 3 را بین آنها رد کرد ، زیرا این تعداد به عنوان یک رویداد توصیف نمی شود. اگر می خواهیم هنگام جستجوی زنجیره رویداد در مثال ، این شماره را در نظر بگیریم ، باید شرط آن را ایجاد کنیم.
در این حالت ، عملکرد نمی تواند زنجیره رویداد را مطابق با الگوی پیدا کند ، زیرا رویداد شماره 3 بین 1 تا 2 رخ داده است. اگر در همان حالت شرط شماره 4 را بررسی کنیم ، دنباله با الگوی مطابقت دارد.
همچنین ببینید
SequenCecount (الگوی) (زمان ، Cond1 ، Cond2 ،…)
تعداد زنجیره های رویداد را که با الگوی مطابقت دارد ، شمارش می کند. عملکرد زنجیره های رویداد را جستجو می کند که با هم همپوشانی ندارند. پس از همسان شدن زنجیره فعلی ، شروع به جستجوی زنجیره بعدی می کند.
رویدادهایی که در همان دوم اتفاق می افتد ممکن است در یک ترتیب نامشخص در نتیجه تأثیر بگذارد.
استدلال
Timestamp - ستون در نظر گرفته شده حاوی داده های زمانی است. انواع داده های معمولی تاریخ و dateTime هستند. همچنین می توانید از هر یک از انواع داده های UINT پشتیبانی شده استفاده کنید.
CONT1 ، CONT2 - شرایطی که زنجیره وقایع را توصیف می کند. نوع داده: uint8. می توانید تا 32 آرگومان شرایط را تصویب کنید. این عملکرد فقط وقایع شرح داده شده در این شرایط را در نظر می گیرد. اگر دنباله حاوی داده هایی باشد که در یک شرایط شرح داده نشده است ، عملکرد آنها را رد می کند.
مولفه های
- الگوی - رشته الگوی. الگوی نحو را ببینید.
مقادیر برگشتی
- تعداد زنجیره های رویداد غیر همپوشانی که همسان هستند.
مثال
داده ها را در جدول T در نظر بگیرید:
تعداد چند برابر شماره 2 را بعد از شماره 1 با هر مقدار شماره دیگر بین آنها بشمارید:
همچنین ببینید
پنجره
جستجو برای زنجیره های رویداد در یک پنجره زمان کشویی و حداکثر تعداد حوادث رخ داده از زنجیره را محاسبه می کند.
عملکرد مطابق با الگوریتم کار می کند:
این تابع داده هایی را جستجو می کند که اولین شرط موجود در زنجیره را ایجاد می کند و پیشخوان رویداد را به 1. تنظیم می کند. این لحظه ای است که پنجره کشویی شروع می شود.
اگر وقایع حاصل از زنجیره به صورت متوالی در پنجره رخ دهد ، پیشخوان افزایش می یابد. اگر دنباله وقایع مختل شود ، پیشخوان افزایش نمی یابد.
اگر داده ها دارای چندین زنجیره رویداد در نقاط مختلف تکمیل باشند ، این عملکرد فقط اندازه طولانی ترین زنجیره را تولید می کند.
نحو
استدلال
- Timestamp - نام ستون حاوی جدول زمانی. انواع داده های پشتیبانی شده: تاریخ ، DateTime و سایر انواع عدد صحیح بدون امضا (توجه داشته باشید که حتی اگر Timestamp از نوع UINT64 پشتیبانی می کند ، ارزش آن نمی تواند از حداکثر INT64 باشد ، که 2^63 - 1 است).
- CONT - شرایط یا داده های توصیف زنجیره وقایع. uint8
مولفه های
- پنجره - طول پنجره کشویی ، فاصله زمانی بین حالت اول و آخر است. واحد پنجره بستگی به خود زمان دارد و متفاوت است. با استفاده از زمان بیان COND1 تعیین شد
- حالت - این یک آرگومان اختیاری است. یک یا چند حالت قابل تنظیم است.
- "strict_deduplication" - اگر همان شرط برای توالی وقایع باشد ، چنین رویدادهای تکراری پردازش بیشتر را قطع می کند.
- 'strict_order' — Don't allow interventions of other events. E.g. in the case of A>B>D>C , it stops finding A>B>C در D و حداکثر سطح رویداد 2 است.
- "Strict_Increase" - شرایط را فقط در مورد وقایع با زمان بندی شدید افزایش دهید.
مقدار برگشتی
حداکثر تعداد شرایط متوالی از زنجیره در پنجره زمان کشویی. تمام زنجیره های موجود در انتخاب مورد تجزیه و تحلیل قرار می گیرند.
مثال
تعیین کنید که آیا مدت زمان مشخصی برای کاربر کافی است که تلفن را انتخاب کند و آن را دو بار در فروشگاه آنلاین خریداری کند.
زنجیره ای از رویدادها را تنظیم کنید:
- کاربر وارد حساب خود در فروشگاه شد (EventID = 1003).
- کاربر برای تلفن جستجو می کند (EventID = 1007 ، محصول = "تلفن").
- کاربر سفارش را قرار داد (EventID = 1009).
- کاربر دوباره سفارش را انجام داد (EventID = 1010).
دریابید که کاربر User_ID تا چه اندازه می تواند در یک دوره در ژانویه و فوریه 2019 از طریق زنجیره ای بدست آورد.
حفظ
این عملکرد به عنوان استدلال مجموعه ای از شرایط از 1 تا 32 آرگومان نوع UINT8 را نشان می دهد که نشان می دهد آیا شرایط خاصی برای این رویداد برآورده شده است یا خیر. هر شرط را می توان به عنوان یک آرگومان مشخص کرد (مانند کجا).
شرایط ، به جز حالت اول ، به صورت جفت اعمال می شود: اگر اول و دوم صحیح باشد ، نتیجه دوم صحیح خواهد بود ، اگر اول و سوم صحیح باشد ، و غیره.
نحو
استدلال
- CONT - عبارتی که نتیجه UINT8 را برمی گرداند (1 یا 0).
مقدار برگشتی
آرایه 1 یا 0.
- 1 - شرط برای این رویداد برآورده شد.
- 0 - شرط برای این رویداد برآورده نشده است.
مثال
بیایید نمونه ای از محاسبه عملکرد حفظ برای تعیین ترافیک سایت را در نظر بگیریم.
1. برای نشان دادن یک مثال یک جدول را تنظیم کنید.
2. کاربران گروه توسط ID UID منحصر به فرد با استفاده از عملکرد نگهدارنده.
3. تعداد کل بازدیدهای سایت در روز را محاسبه کنید.
- R1-تعداد بازدید کنندگان منحصر به فرد که در طی سالهای 2020-01-01 (وضعیت COND1) از سایت بازدید کرده اند.
- R2-تعداد بازدید کنندگان منحصر به فرد که در طی یک دوره زمانی خاص بین سالهای 2020-01-01 و 2020-01-02 (شرایط COND1 و COND2) از سایت بازدید کرده اند.
- R3-تعداد بازدیدکنندگان منحصر به فرد که طی یک دوره زمانی خاص بین سالهای 2020-01-01 و 2020-01-03 (شرایط COND1 و COND3) از سایت بازدید کرده اند.
uniqupto (n) (x)
اگر تعداد مقادیر آرگومان مختلف بیشتر از N باشد ، تعداد مقادیر مختلف آرگومان را محاسبه می کند.
برای استفاده با NS کوچک ، حداکثر 10 توصیه می شود. حداکثر مقدار N 100 است.
برای وضعیت یک عملکرد کل ، از مقدار حافظه برابر با 1 + n * اندازه یک مقدار بایت استفاده می کند. برای رشته ها ، هش غیر کریپتوگرافی 8 بایت را ذخیره می کند. یعنی محاسبه برای رشته ها تقریبی است.
این عملکرد همچنین برای چندین آرگومان کار می کند.
این کار به همان سرعت ممکن است ، به جز مواردی که از مقدار N بزرگ استفاده می شود و تعداد مقادیر منحصر به فرد کمی کمتر از N است.
summapfiltered (keys_to_keep) (کلیدها ، مقادیر)
همان رفتار Summap به جز اینکه مجموعه ای از کلیدها به عنوان یک پارامتر منتقل می شوند. این می تواند به خصوص در هنگام کار با کاردینال بودن کلیدها مفید باشد.
ترتیب
مقدار رویداد بعدی را که با یک زنجیره رویداد مطابقت دارد ، برمی گرداند.
عملکرد آزمایشی ، برای فعال کردن آن ، altes_experimental_funnel_functions = 1 را تنظیم کنید.
نحو
مولفه های
جهت - برای حرکت به سمت جهت استفاده می شود.
- به جلو - حرکت به جلو.
- به عقب - در حال حرکت به عقب.
پایه - برای تنظیم نقطه پایه استفاده می شود.
- سر - نقطه پایه را به اولین رویداد تنظیم کنید.
- دم - نقطه پایه را روی آخرین رویداد تنظیم کنید.
- First_Match - نقطه پایه را روی اولین رویداد همسان 1 تنظیم کنید.
- Last_Match - نقطه پایه را روی آخرین رویداد همسان 1 تنظیم کنید.
استدلال
- Timestamp - نام ستون حاوی جدول زمانی. انواع داده های پشتیبانی شده: تاریخ ، DateTime و سایر انواع عدد صحیح بدون امضا.
- event_column - نام ستون حاوی مقدار رویداد بعدی که باید برگردانده شود. انواع داده های پشتیبانی شده: رشته و قابل تهی (رشته).
- BASE_CONDITION - شرط اینکه نقطه پایه باید انجام شود.
- رویداد 1 ، رویداد 2 ،.- شرایط توصیف زنجیره وقایع. uint8
مقادیر برگشتی
- event_column [next_index] - اگر الگوی همسان باشد و مقدار بعدی وجود داشته باشد.
- NULL - اگر این الگوی مطابقت نداشته باشد یا مقدار بعدی وجود ندارد.
مثال
It can be used when events are A>B>C>D>E and you want to know the event following B>C ، که D. است
تجارت با گزینههای باینری...
ما را در سایت تجارت با گزینههای باینری دنبال می کنید
برچسب :
نویسنده : حمیدرضا پگاه
بازدید : 41
تاريخ : پنجشنبه
21 ارديبهشت
1402 ساعت: 12:39