Entendendo o Desempenho de Rede - VPN Site a Site com Desempenho Ruim

Estou tendo problemas com baixo desempenho em uma conexão VPN site a site. Usuários de um site remoto reclamam de baixa performance ao tentar usar Revit e/ou abrir arquivos do nosso servidor principal. Algumas informações que acho relevantes:

  • Largura de banda do Site A (local do servidor de arquivos): 150Mbps Simétrica

  • Largura de banda do Site B (local remoto): 1Gbps Simétrica

  • Latência entre os sites: 50ms

  • VPN site a site entre dois Watchguard M370

  • Servidor de Arquivos é Windows Server 2016

  • Máquinas clientes são Windows 10 Pro

Algumas características de desempenho:

  • Transferência LAN de um arquivo zip de 10GB de máquina para máquina no Site B é muito constante, aproximadamente 30MB/s (Rede Gbps)

  • Transferência WAN de um arquivo zip de 10GB do Site B para nosso servidor de arquivos no Site A é aproximadamente 15MB/s

  • Transferência WAN de um zip de 10GB do servidor de arquivos no Site A para o Site B flutua entre 350KB/s e 705KB/s, com um pico ocasional de 2.0MB/s

Tenho pesquisado esse problema e tentando melhorar o desempenho, mas não consigo encontrar um ponto de partida adequado. Com base na minha pesquisa, percebo que o protocolo SMB não é muito adequado para transmissões WAN. Quando executo iPerf obtenho os seguintes resultados:

Site B para Site A

Site A para Site B

Com base na minha pesquisa sobre o problema, acho que tenho uma ideia clara do que está acontecendo. Acredito que tenho uma Rede Longa e Gorda e não consigo saturar a largura de banda entre os dois sites. Basicamente, estou sendo impedido por grandes pipes, alta latência e o protocolo TCP muito falante que é o SMB (não se preocupe, o V1 está desativado em TODA A ORGANIZAÇÃO). No entanto, não sei como combinar as informações que encontrei para desenvolver uma solução para o desempenho ruim. Sei que posso calcular o Produto de Atraso de Largura de Banda (BDP) e, pelo que percebo, posso ajustar o MTU para ajustar a quantidade de dados em voo para cada quadro. Pesquisas adicionais me ensinaram sobre ajuste automático e escalonamento de lado de recepção para ajudar a aumentar o tamanho do quadro durante uma transmissão TCP. No entanto, sinto que estou ficando mais longe de resolver o problema. A propriedade da empresa acha que aumentar a largura de banda do site A ajudará a resolver o problema (por isso, uma conexão de internet com maior banda está sendo configurada neste sábado por mim), mas não tenho certeza se essa é a solução. Estou na direção certa ao olhar para BDP, MTU e tamanho do quadro? Há uma maneira melhor de abordar um problema de desempenho assim? Quais passos devo dar a seguir para até mesmo resolver esse tipo de problema? Agradeço desde já por qualquer ajuda que puderem oferecer.

Quais são os valores de MTU configurados?

Quais são os valores de MSS Clamping configurados?

Qual é a latência de ida e volta do fonte ao destino (e vice-versa) ?