У меня большие данные с 12 столбцами. Где MatchId дублируется.
df1.columns
Out[569]:
Index(['MatchId', 'Event_Id', 'EventCode', 'Team1', 'Team2', 'Team1_Goals',
'Team2_Goals', 'xG_Team1', 'xG_Team2', 'CurrentPlaytime',
'Home_Goal_Time', 'Away_Goal_Time'],
dtype='object')
Для условия df1.loc[df1.Home_Goal_Time >= 200, 'MatchId']
, я хочу, чтобы все MatchId, связанные с этим условием, были удалены из df1
.
df_filtered = df1.query('Home_Goal_Time<200')
Это отфильтровывает строки, которые вам не интересны.
Если я правильно понял, вы хотите:
df1 = df1[~df1['MatchId'].isin(df1.loc[df1.Home_Goal_Time >= 200, 'MatchId'])]