大規模言語モデルで「無限の入力」を受け付けることを可能にする手法「StreamingLLM」が開発される