То, что Вы видите в аудиоредакторах это не промежутки времени, а выборки (образцы, сэмплы). При частоте дискретизации 48 кГц на одну миллисекунду приходится 48 выборок. И в принципе верно - при замене канала подгонку нужно делать с точностью до одной выборки.
Но в Вашем случае сама идея порочна. Лепить центр из дутой многоканалки в оригинал не есть комильфо. В приличном обществе за такие штучки канделябрами бьют.