تداول استخراج البيانات الاستراتيجية




كيفية ترميز استراتيجيات التداول رياضيا (. على سبيل المثال الأرقام القياسية، FX، والسلع الأساسية، وأسعار الفائدة) إذا كان لديك مجموعة من البيانات المختلفة الاقتصاد القياسي يمكنك محاولة لإيجاد صيغة لمعرفة ما إذا كان هناك أي علاقة في البيانات - على سبيل المثال للتنبؤ بها هذا النمط اكتشافها. ما أطلبه هنا يختلف قليلا: هل هناك طريقة أخرى بمعنى أنه يمكنك بحث عن و صيغة () بحيث شكل معين يمثل استراتيجية التداول حيث توجد بعض المؤشرات عند الذهاب طويلة أو قصيرة (أو أي تركيبات المشتقة)؟ والفكرة هي أن الصيغة نفسها تعيش في الفضاء ن الأبعاد للمؤشرات / المتاجرة الاستراتيجيات ويحاول البقاء على قيد الحياة أفضل ما يمكن. يجب أن يكون هذا الإجراء القياسي لمتعدد النظم وكيل محاكاة أسواق الأسهم الاصطناعية. للأسف، أنا غير قادر على إيجاد مقاربة بسيطة لفعل ذلك. تعدين البيانات وقد وفرت التطور السريع لتكنولوجيا الكمبيوتر في العقود القليلة الماضية ممتهني الاستثمار (والهواة) مع القدرة على الوصول إلى وتحليل كميات هائلة من البيانات المالية. بالإضافة إلى ذلك، واسعة مجالس شبكة الإنترنت، والبريد الإلكتروني، ونشرة العالم تجعل من الممكن للناس في جميع أنحاء العالم للوصول إلى هذه المعلومات بسرعة، فضلا عن توفير وسيلة للأفراد للتعبير عن آرائهم والتفاعل. ونتيجة لذلك، فقد تدور بعض الموضوعات أكثر إثارة للاهتمام من النقاش في السنوات الأخيرة حول الممارسة والنتائج المترتبة على "استخراج البيانات". ويشمل استخراج البيانات من خلال البحث في قواعد البيانات عن علاقات وأنماط تختلف عن النتائج التي سيتم المتوقع أن يحدث عن طريق الصدفة أو في ظروف عشوائية. ممارسة التنقيب عن البيانات في حد ذاتها ليست جيدة أو سيئة، وأصبح استخدام استخراج البيانات المشتركة في العديد من الصناعات. على سبيل المثال، في محاولة لتحسين قد يستخدم الباحثون متوسط ​​العمر المتوقع استخراج البيانات لتحليل الأسباب والعلاقات المتبادلة مع معدلات الوفيات. يستخدم التعدين البيانات أيضا من قبل المعلنين وشركات التسويق لاستهداف المستهلكين. ولكن ربما مجموعة أعتى من عمال المناجم البيانات الباحثون سوق الأوراق المالية التي تسعى للتنبؤ حركة سعر السهم في المستقبل. معظم إن لم يكن قد تم اكتشاف عن سوق الأوراق المالية والعيوب (أو على الأقل موثقة) عن طريق استخراج البيانات من الأسعار السابقة والمتغيرات ذات الصلة (أو غير ذات صلة في بعض الأحيان). عندما يتم اكتشاف استراتيجيات الضرب السوق عن طريق استخراج البيانات، وهناك عدد من المشاكل المحتملة في اتخاذ قفزة من استراتيجية اختبار مرة أخرى إلى تستثمر بنجاح في ظروف العالم الحقيقي في المستقبل. المشكلة الأولى هي تحديد احتمال أن حدثت العلاقات عشوائيا أو ما إذا قد تكون شاذة فريدة من نوعها لعينة محددة الذي تم اختباره. الإحصاء مغرمون لافتا إلى أنه إذا كنت التعذيب البيانات طويلة بما فيه الكفاية، وسوف أعترف بأي شيء. في ما أصبح مثالا الشائنة ذهب ديفيد Leinweber البحث عن ارتباطات عشوائية إلى S & P 500. وصف بيتر كوي النتائج Leinweber في مقال بعنوان بيزنس ويك "الذي بيانات الألغام قد ضرب ذهب الأحمق" (6/16/97). استخراج المادة ناقش البيانات، كتاب مايكل Drosnin في قانون الكتاب المقدس. والواقع أن أنماط سيحدث في البيانات عن طريق الصدفة، وخاصة إذا كنت تنظر العديد من العوامل. كثير من الحالات من استخراج البيانات ليست محصنة ضد التحقق الإحصائي أو الطعن. وفي وصفه للمطبات استخراج البيانات، Leinweber "منخول خلال ROM CD-الأمم المتحدة واكتشفت أن تاريخيا، كان أفضل عامل ينبئ مؤشر 500 سهم ستاندرد بورز إنتاج الزبدة في بنغلاديش". والدرس الذي يتعلم وفقا لكوي هو "صيغة ما يحدث لاحتواء البيانات من الماضي لن يكون بالضرورة أي القيمة التنبؤية." وقد تم اختبار الخلفي دائما فئة مشبوهة من المعلومات. عندما تنظر إلى الوراء، وأنت تسير فقط لاظهار ما هو جيد. تعتبر الشذوذ اكتشافها من خلال استخراج البيانات لتكون أكثر أهمية باعتبارها فترة من الوقت الزيادات وإذا كان من الممكن أكد الشذوذ في الخروج من الاختبارات عينة على مدى فترات زمنية مختلفة وأسواق مماثلة (على سبيل المثال في البورصات الأجنبية). إذا تم اكتشاف حالة شاذة في الاختبارات مرة أخرى، ولها أيضا أهمية لتحديد كيفية التكاليف (تكاليف المعاملات، والعرض والطلب نشر وتكاليف أثر لتجار المؤسسي) من شأنه أن يقلل من العوائد. بعض الحالات الشاذة هي ببساطة ليست البيعية. رؤية الشذوذ خط قيمة والعجز التنفيذ لمعرفة المزيد عن هذا الموضوع. بالإضافة إلى ذلك، قد الاستراتيجيات التي عملت في الماضي تتوقف ببساطة يعمل المزيد من المستثمرين البدء في الاستثمار وفقا لهذه الاستراتيجية. رؤية فرضية كفاءة السوق لمعرفة المزيد عن هذا الموضوع. وقد أشاد المغفلة المتعدد الألوان من قبل الكثيرين لتقديم المشورة التعليمية للمستثمرين الأفراد (على سبيل المثال، المغفلة المتعدد الألوان تقدم توصيات سليمة في تقديم المشورة للمستثمرين وعقد شراء اسهم، أن نكون حذرين من وسطاء الأوراق المالية والمحللين تضارب المصالح، وإلى أن نكون حذرين مطالبات أداء غير واقعية). ولكن "أحمق أربعة" استراتيجية الأسهم المغفلة المتعدد الألوان والمنطق الذي يستند إليه وقد وجهت انتقادات. في عام 1997، coathored جامعة بريغهام يونغ أساتذة منحة ماكوين وستيفن Thorley ورقة في المحللين الماليين مجلة (FAJ) الذي شكك في الكلاب شعبية هائلة من استراتيجية داو (ملخص). وجود بالفعل جمع البيانات لتحليل مؤشر داو جونز الكلاب، تليها الأساتذة تصل عن طريق دراسة حالة في استخراج البيانات من ثوب المهرج غبي أحمق في أربعة. ماكوين وThorley تحليل جهولا أربعة كما هو موضح في ثوب المهرج غبي دليل الاستثمار (MFIG)، ولكن السفيه فعلا اختلافات متعددة من جهولا أربعة (انظر أوضح أيضا أحمق أحمق أربعة وأربعة التاريخ). أدت تلك البحوث في مقال آخر نشر في مارس / أبريل 1999 قضية من المحللين الماليين مجلة بعنوان "الذهب كذبة التعدين في." في روح من التسلية والإبداعية أسلوب الكتابة على كذبة، وقد نشرت الأساتذة و"خفيف الظل" نسخة من ورقة (في برفكت) على ملقم جامعة بريغهام يونغ. البيانات المستخدمة في الدراسة يمكن تحميلها من هنا. ماكوين وThorley تشمل شرحا وافيا من المزالق المحتملة لاستخراج البيانات وأجروا من اختبارات العينة على جهولا أربعة. السبب الأساتذة أن استخراج البيانات يمكن الكشف عنها بواسطة تعقيد حكم التداول، وعدم وجود قصة متماسكة أو نظرية، وأداء خارج عينة الاختبارات، وتعديل العوائد للخطر، وتكاليف المعاملات، والضرائب. بالإضافة إلى ذلك، ويقولون أن القواعد التجارية جهولا أربعة وداو عشر قد أصبحت ذات شعبية كبيرة بما يكفي للتأثير على أسعار الأسهم في مطلع هذا العام. وقد نشر المغفلة المتعدد الألوان استجابة الحماسية إلى ورقة FAJ في جهولا أربعة تقارير محافظهم التي يمكن الوصول إليها في هم 1999 المحفوظات. انظر تقارير بتاريخ 10/5. 11/05. 12/05. 13/05. 14/05. 17/05. 18/05. 19/05. 20/05. و21/05. وشملت هذه الردود في العديد من الحجج المضادة لورقة FAJ وكذلك شكر وتقدير من القضايا صالحة مناقشتها في الورقة. في حين أن العديد من القضايا هي قابلة للنقاش، وكان اختبار الحمض الحقيقي والنتيجة حاسمة من ورقة FAJ للخروج من عينة الاختبار لالسفهاء أربعة عوائد من 1949 إلى 1972. ولهذا الفترة جهولا أربعة بالكاد فاز مؤشر داو جونز 30 بمتوسط 0.32٪ سنويا مع أكبر بكثير من المخاطر. لم يكن سوى استراتيجية أداؤهم الكلاب داو للفترة، ولكن بعد تكاليف المعاملات والمحاسبة للخطر بشكل واضح قد تخلفت مؤشر داو جونز الصناعي لهذه الفترة. وقد نوقشت هذه القضية الحساسة لفترة وجيزة في تقرير مؤرخ 14/05. لوضع هذه المسألة في وجهات النظر، والنظر مستثمر في بداية عام 1973 إذا نظرنا إلى الوراء في أداء مؤشر داو جونز الصناعي على مدى 24 عاما السابقة. أنه من الصعب لترشيد كيف يمكن لمستثمر يستطيع أن يعرف في ذلك الوقت أن جهولا أربعة من شأنها أن تنتج عوائد ضرب السوق للمضي قدما. في آخر من اختبار العينة، ماكوين وThorley تستخدم قاعدة 1973 -1996 الفترة التي نوقشت في MFIG، ولكنها تستخدم يوليو لإعادة التوازن بدلا من يناير كانون الثاني. في ظل هذه الظروف السفهاء أربعة عوائد فاقت مؤشر داو جونز الصناعي 2.95٪ فقط سنويا في المتوسط، أقل بكثير من ميزة 12.23٪ على مؤشر داو جونز الصناعي مع إعادة التوازن يناير. دفاعا عن السفيه، أدلى بعض الأمور على الأقل في MFIG وعلى موقع على شبكة الإنترنت. في تقرير جهولا أربعة بتاريخ 8/7/98. أنها تكشف أن العائدات كانت أقل عندما وقعت إعادة التوازن في غيره من الشهور من يناير كانون الثاني. بالإضافة إلى ذلك، في MFIG يتم استخدام الرقم المقابل 25.5٪ من فترة عشرين سنة مرات عديدة، لكنهم على الأقل أذكر أنها بحثت الأرقام إلى 1961 وللفترة زمنية أطول، انخفضت عائدات 18.35٪. من ناحية أخرى، بمجرد أن يتم الإفصاح عن أن فترة أطول من الزمن ودرس، والاستمرار في الاستشهاد أقوى الأرقام القصيرة الأجل، والحجج مستندة على تلك البيانات بالتأكيد يمكن أن ينظر إليه باعتباره المشتبه فيه. الكشف عن والتركيز على النتائج على المدى الطويل يميل إلى زيادة مصداقية الحجة عامل منجم بيانات ل. أعرب جيسون تسفايغ رأيه في جهولا أربعة ويشارك بياناته الخاصة الملغومة "غبي جدا" والمحافظ "اضافية البكم" في الأرباح كاذبة من مجلة المال (أغسطس 1999). على موقع على شبكة الإنترنت مورنينغستار يمكنك أيضا قراءة الرأي جون Rekenthaler في مجرد foolin "حول وكذلك مستشار الاستثمار وليام بيرنشتاين اراء الصورة في مقال بعنوان الملغومة: جميع الملغومة (انظر أيضا استجابة جيمس O'Shaughnessy الصورة والمناقشة التي تلت ذلك) . في ديسمبر 2000، أعلنت المغفلة المتعدد الألوان أنها لم تعد الدعوة إلى "أحمق أربعة" استراتيجية الأسهم، التي كانت قد أنشئت. رؤية إعادة التفكير في جهولا أربعة لالأساس المنطقي وراء كذبة لم تعد التوصية الاستراتيجية التي قد توصف لسنوات عبر موقع على شبكة الإنترنت والكتب. الانتقال إلى مناقشة آخر التنقيب عن البيانات، وليام بروك. جوزيف Lakonishok. وبليك ليبارون (BLL) نشرت مقالا بعنوان "قواعد التداول بسيطة التقنية وخصائص مؤشر ستوكاستيك من اسهم العوائد،" في طبعة ديسمبر 1992 من مجلة التمويل. وتعد هذه الدراسة واحدة من الدراسات الأكاديمية القليلة لتوثيق استراتيجية تجارية ناجحة تقوم على التحليل الفني (انظر العيوب الفنية لمناقشة كاملة من هذه المادة). أظهر الأساتذة أن كلا من المتوسطات المتحركة والدعم والمقاومة أدوات كانت القيمة التنبؤية المتعلقة داو جونز الصناعي المتوسط ​​للفترة 1897-1986. بيانات استطلاع والتقنية الأداء التداول القاعدة، والتمهيد هي المادة التي يتطرق الورقة BLL وسوف تظهر في أكتوبر 1999 طبعة من مجلة التمويل. في هذه المادة، ريان سوليفان، ألان تيمرمان، وهولبرت الأبيض (STW) محاولة لتحديد أثر-التطفل بيانات عن نتائج BLL. كما أنها تستخدم البيانات التي تم جمعها من الفترة التي تلت الدراسة الأصلية (بيانات BLL ركض من خلال 1986) من أجل توفير من اختبار العينة. واضاف ان السنوات الأخيرة قدمت 100 سنة كاملة من البيانات. STW تحسب حتى كسر المعاملة مستوى تكلفة 0.27٪ في المائة التجارية للحصول على أفضل حكم التداول الأداء للفترة الكاملة. لأن البيانات BLL الأصلية غطت فترة طويلة للغاية ما يقرب من 90 عاما، قد يتوقع المرء الاستراتيجيات لأداء جيدا في الخروج من اختبارات العينة. لكن استنتاجات الدراسة قد ينتهي تستخدم كمثال محتمل آخر من فرضية كفاءة السوق. STW العثور على "أن تظهر نتائج BLL أن تكون قوية إلى التطفل البيانات. ومع ذلك، نجد أيضا أن أداء متفوق من أفضل حكم التداول لا تتكرر في تجربة الخروج من عينة يغطي الفترة 1987-1996" و "هناك أدلة تذكر أن القواعد التجارية الفنية كانت من أي قيمة اقتصادية خلال الفترة 1987-1996." هذا قد تقدم التحذير أخرى لعمال المناجم بيانات البورصة والمستثمرين نشطة. حتى لو عملت حالة شاذة في الماضي على مدى فترات طويلة جدا من الزمن، وحتى لو لم تظهر النتائج أن يعاني من المزالق البيانات التطفل، بمجرد اكتشاف الشذوذ قد تتوقف عن العمل للمضي قدما. الناس معقول يمكن أن يكون هناك اختلاف في الرأي معقول دون أن تصبح قضية الأخلاق أو الدين. الكفاءة المزعجة (RR) من داو جونز لإدارة الأصول (5-6 / 99) هو مادة مثيرة للاهتمام أن يناقش استخراج البيانات ومشكلة "overfitting". وشملت هي تعليقات من قدامى المحاربين في صناعة الاستثمار ديفيد شو. تيد آرونسون. وروبرت أرنوت. وتقول المادة التي تعطى كمية محدودة من البيانات التاريخية وعدد لا حصر له من النماذج المعقدة، قد أغرى المستثمرين جهل إلى "overfitting" البيانات. الأنماط التي يفترض أن تكون منهجي قد يكون في الواقع عينة محددة، وبالتالي لا قيمة لها. الناس يأتون لنا في كل وقت مع استراتيجيات التداول التي يقال تحقيق عوائد الزائدة كبيرة جدا. ولكن الغالبية العظمى من الأشياء التي يكتشف الناس من خلال اتخاذ الأدوات الرياضية القياسية وغربلة من خلال الكم الهائل من البيانات الإحصائية التحف. يقول آرونسون أن السوق هو "نحو فعال تماما"، وأنه "أنت خداع نفسك إذا كنت تعتقد أنك سوف تفوق الرجل الآخر بأكثر من حوالي 51٪ أو 52٪ من الوقت." ويعتقد ارونسون أن المستثمرين يبحثون عن عدم كفاءة السوق قد قللت من إمكانية الاستفادة من تلك الحالات الشاذة إلى ما يعادل تكاليف المعاملات. إذا كان هذا هو الحال، والتقليل من تكاليف المعاملات أمر بالغ الأهمية في محاولة للتغلب على السوق. لذلك هل هناك أي الحالات الشاذة التي تأكدت في الخروج من الاختبارات عينة؟ في مجلة المالية المادة المقبلة آخر، جيمس ديفيس، يوجين فاما F.. ويقول كينيث R. الفرنسية أن الجواب هو نعم قاطعة. الشركات مع انخفاض السعر لحجز نسب قيمة يتفوق وقد تم توثيق هذا النمط في أسواق كل من الولايات المتحدة والأجنبية. في خصائص، التغايرات، ومتوسط ​​العوائد: 1929-1997 المؤلفين تذهب خطوة كبيرة أخرى في توثيق عوائد منخفضة السعر لحجز أسهم القيمة من 1929 إلى 1963. وبالنسبة للفترة السابقة، وكان قسط قيمة أكبر (0.50 في المائة شهر) من أكثر حداثة يوليو 1963 إلى يونيو 1997 الفترة (0.43٪ شهريا). في النهاية، هل نحن من أي وقت مضى نعرف حقا بالتأكيد ما هي الاستراتيجيات سوف يتفوق في المستقبل؟ الآراء بشأن هذه المسألة تختلف بالتأكيد، ولكن ينطبق هذا العقد القياسي كما هو الحال دائما. الأداء السابق ليس ضمانا للأداء المستقبلي. وشملت المناقشات الرياضية إضافية في قطف الكرز. احتيال سوق الأوراق المالية. وصفحات المصغرة التقليب. يرجى ارسال اقتراحات وتعليقات للمستثمر الرئيسية 2001/2/12 آخر تحديث. 2001 مستثمر الرئيسية. جميع الحقوق محفوظة. إخلاء المسؤولية انا تقدم خدمات المهنية في مجالات الاستشارات الإحصائية والمالية. أحمل درجة الدكتوراه في الإحصاء والدكتوراه الصغرى في العلوم المالية من جامعة ستانفورد. لقد عملت في هذه الصناعة لمدة أربع سنوات، مع التركيز على المشاريع المتعلقة استخراج البيانات، وتحليل العوامل، التحليل العنقودي، تحليل السلاسل الزمنية، والنمذجة التقلبات العشوائية / تسعير الأصول، المراجحة الإحصائية / تطوير استراتيجيات التداول الملكية، وهلم جرا. بنفس القدر من الأهمية، ولدي ست سنوات من الخبرة للاستشارات المالية والإحصائية. وقد تشاورت الشركات ورجال الأعمال والباحثين والطلاب في مجالات التسويق، الطب، علم الأحياء، علم النفس، علم الاجتماع، العلوم السياسية، التعليم، علوم الحاسب الآلي والمالية. في موقع الحكمة، وقد وضعت موكلي في نيويورك وبوسطن وفيلادلفيا وواشنطن ولوس أنجلوس وسان فرانسيسكو، سان خوسيه، ستانفورد، سياتل وشيكاغو وتورنتو ومونتريال ولندن وأدنبرة، بيرغن، فرانكفورت، مدينة الكويت، كونغ هونغ، أديليد وملبورن وسيدني وهلم جرا. عادة، التقيت في مانهاتن أو استشارة عبر سكايب، البريد الإلكتروني والهاتف إذا العملاء لا تزال بعيدة عن نيويورك. بالإضافة إلى ذلك، والقيام بمشاريع كاملة لموكلي، والتي قد تكون أو لا تتطلب عقد اجتماع. أمثلة من الخدمات: تحليل البيانات في أي من الحزم الإحصائية الأساسية (R، ماتلاب، SAS، SPSS، ستاتا)، تصميم التجارب، وتطوير التسعير والتداول أنظمة والمساعدة أطروحة والاستشارات دورات لتحسين المعرفة العامة. يرجى قراءة وصف تفصيلي لأنواع الخدمات. خبرة. دراسات الحالة وخيارات الدفع. ما لم الاستعجال هو المشاركة، سعر 60 $ للساعة الواحدة للمشاريع القياسية (الانحدار، أنوفا، تصميم المسح والاختبارات غير المعلمية) وأكثر لمواد عالية التقنية (استخراج البيانات، التحليل العنقودي، والبيانات لوحة، سلسلة زمنية متعددة المتغيرات، نماذج ماركوف المخفية ، سلسلة ماركوف مونتي كارلو، والنمذجة النظرية الافتراضية، GWAS، وظائف SAS، استراتيجيات المراجحة / تداول الإحصائية، تسعير الأصول الغريبة، وإدارة مخاطر السوق). يرجى مراسلتي عبر البريد الإلكتروني للحصول على معلومات أكثر تفصيلا التسعير أو أي توضيح آخر. consultingstanfordphd