لماذا نستخدم خطوط الأنابيب (Pipelines)؟
تمنع خطوط الأنابيب تسرب البيانات من خلال ضمان أن جميع التحويلات (مثل القياس) يتم تطبيقها فقط على بيانات التدريب أثناء التحقق المتقاطع.
مثال لخط الأنابيب
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
pipeline = Pipeline([
('scaler', StandardScaler()),
('classifier', LogisticRegression())
])
pipeline.fit(X_train, y_train)